AI / LLM
Агенты: тест с множественным выбором
Шесть вопросов через весь юнит. Каждый — это решение, которое вы принимаете, проектируя или отлаживая реального агента: не определение для пересказа, а компромисс, который надо взвесить, пока цикл крутится на чьём-то счёте.
Убедиться, что вы связываете механику цикла, экономику растущего контекста, набор выходов, которые нужны циклу, гигиену error recovery и выбор «скрипт или agent» — тот синтез, к которому вёл урок.
Задача на 5 шагов агента стоит около $0.05. Тот же агент на задаче в 15 шагов стоит около $0.40 — примерно 8×, а не 3×. Почему?
Запрос агента, который должен стоить $0.08, крутился девять минут и сжёг $12. В трейсе search_orders вызван 142 раза с одинаковыми аргументами, каждый раз возвращая один и тот же пустой результат. Исключений не было. В чём корень?
Поток поддержки всегда делает одни и те же три шага: найти заказ, проверить право на возврат, выдать или отклонить возврат. Коллега предлагает открытого агента со всеми тремя инструментами и recursion_limit=25. Что лучше и почему?
Сеньор говорит: «относись к лимиту шагов как к ремню безопасности, а не как к рулю». Что это значит на практике?
Долгий агент дошёл до шага 40, и история переросла окно контекста модели. Фреймворк молча обрезает самые старые сообщения. Каково самое вероятное последствие?
Когда вызов инструмента падает, частый паттерн — отдать текст ошибки модели как следующее наблюдение. Почему это одновременно суперсила и ловушка?
Сквозная линия — одна проектная дисциплина: цикл переотправляет всю историю каждый ход, поэтому стоимость квадратична по шагам, а долгий прогон переполняет окно и роняет собственные инструкции. У наивного цикла единственный выход, до которого модель может не дойти, поэтому добавляют независимые: естественный stop, лимит шагов (ремень), бюджет по wall-clock/токенам, реально ограничивающий доллары, и dedup/progress-проверку, убивающую thrashing. Error-feedback — суперсила recovery и ловушка runaway; ограничьте её лимитом retry на инструмент. И прежде всего спросите, известен ли путь — если да, заскриптуйте, а открытого агента берегите для шагов, которые честно нельзя перечислить заранее.