awesome-everything EN
↑ Обратно к восхождению

AI / LLM

Агенты: тест с множественным выбором

Суть Синтез по всему юниту в формате выбора — цикл ReAct, квадратичная стоимость контекста, выходы из цикла (termination), ловушки error recovery и когда писать скрипт вместо agent.
Высота — путь к senior
НольJuniorMiddleSenior
Ты на senior-высоте — в орбите
◷ 13 min

Шесть вопросов через весь юнит. Каждый — это решение, которое вы принимаете, проектируя или отлаживая реального агента: не определение для пересказа, а компромисс, который надо взвесить, пока цикл крутится на чьём-то счёте.

Цель

Убедиться, что вы связываете механику цикла, экономику растущего контекста, набор выходов, которые нужны циклу, гигиену error recovery и выбор «скрипт или agent» — тот синтез, к которому вёл урок.

Викторина

Задача на 5 шагов агента стоит около $0.05. Тот же агент на задаче в 15 шагов стоит около $0.40 — примерно 8×, а не 3×. Почему?

Викторина

Запрос агента, который должен стоить $0.08, крутился девять минут и сжёг $12. В трейсе search_orders вызван 142 раза с одинаковыми аргументами, каждый раз возвращая один и тот же пустой результат. Исключений не было. В чём корень?

Викторина

Поток поддержки всегда делает одни и те же три шага: найти заказ, проверить право на возврат, выдать или отклонить возврат. Коллега предлагает открытого агента со всеми тремя инструментами и recursion_limit=25. Что лучше и почему?

Викторина

Сеньор говорит: «относись к лимиту шагов как к ремню безопасности, а не как к рулю». Что это значит на практике?

Викторина

Долгий агент дошёл до шага 40, и история переросла окно контекста модели. Фреймворк молча обрезает самые старые сообщения. Каково самое вероятное последствие?

Викторина

Когда вызов инструмента падает, частый паттерн — отдать текст ошибки модели как следующее наблюдение. Почему это одновременно суперсила и ловушка?

Итог

Сквозная линия — одна проектная дисциплина: цикл переотправляет всю историю каждый ход, поэтому стоимость квадратична по шагам, а долгий прогон переполняет окно и роняет собственные инструкции. У наивного цикла единственный выход, до которого модель может не дойти, поэтому добавляют независимые: естественный stop, лимит шагов (ремень), бюджет по wall-clock/токенам, реально ограничивающий доллары, и dedup/progress-проверку, убивающую thrashing. Error-feedback — суперсила recovery и ловушка runaway; ограничьте её лимитом retry на инструмент. И прежде всего спросите, известен ли путь — если да, заскриптуйте, а открытого агента берегите для шагов, которые честно нельзя перечислить заранее.

Продолжить восхождение ↑Агенты: тест на свободное воспроизведение
хоткеи развернуть
поиск
K
пред. пьеса
k
след. пьеса
j
тиры
t
это меню
?
sources3
expand
  1. 01
  2. 02
  3. 03

Trademarks belong to their respective owners. Editorial reference only.