AI / LLM AI · 06 · 07

Агенты: тест с множественным выбором

Синтез по всему юниту в формате выбора — цикл ReAct, квадратичная стоимость контекста, выходы из цикла (termination), ловушки error recovery и когда писать скрипт вместо agent.

AI Senior ◷ 13 min

Уровень

ОсновыJuniorMiddleSenior

Шесть вопросов через весь юнит. Каждый — это решение, которое вы принимаете, проектируя или отлаживая реального агента: не определение для пересказа, а компромисс, который надо взвесить, пока цикл крутится на чьём-то счёте.

Цель

Убедиться, что вы связываете механику цикла, экономику растущего контекста, набор выходов, которые нужны циклу, гигиену error recovery и выбор «скрипт или agent» — тот синтез, к которому вёл урок.

Викторина

Задача на 5 шагов агента стоит около $0.05. Тот же агент на задаче в 15 шагов стоит около $0.40 — примерно 8×, а не 3×. Почему?

Викторина

Запрос агента, который должен стоить $0.08, крутился девять минут и сжёг $12. В трейсе search_orders вызван 142 раза с одинаковыми аргументами, каждый раз возвращая один и тот же пустой результат. Исключений не было. В чём корень?

Викторина

Поток поддержки всегда делает одни и те же три шага: найти заказ, проверить право на возврат, выдать или отклонить возврат. Коллега предлагает открытого агента со всеми тремя инструментами и recursion_limit=25. Что лучше и почему?

Викторина

Сеньор говорит: «относись к лимиту шагов как к ремню безопасности, а не как к рулю». Что это значит на практике?

Викторина

Долгий агент дошёл до шага 40, и история переросла окно контекста модели. Фреймворк молча обрезает самые старые сообщения. Каково самое вероятное последствие?

Викторина

Когда вызов инструмента падает, частый паттерн — отдать текст ошибки модели как следующее наблюдение. Почему это одновременно суперсила и ловушка?

Итог

Сквозная линия — одна проектная дисциплина: цикл переотправляет всю историю каждый ход, поэтому стоимость квадратична по шагам, а долгий прогон переполняет окно и роняет собственные инструкции. У наивного цикла единственный выход, до которого модель может не дойти, поэтому добавляют независимые: естественный stop, лимит шагов (ремень), бюджет по wall-clock/токенам, реально ограничивающий доллары, и dedup/progress-проверку, убивающую thrashing. Error-feedback — суперсила recovery и ловушка runaway; ограничьте её лимитом retry на инструмент. И прежде всего спросите, известен ли путь — если да, заскриптуйте, а открытого агента берегите для шагов, которые честно нельзя перечислить заранее. Теперь, когда встретите вопрос о дизайне или ревью агента, первое, что проверяете: сколько у цикла независимых выходов — и нужен ли вообще агент для этой задачи?

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.