AI / LLM AI · 06 · 08

Агенты: тест на свободное воспроизведение

Запросы на свободное воспроизведение по всему юниту. Сначала ответьте своими словами, затем раскройте модельный ответ и сверьтесь.

AI Senior ◷ 14 min

Уровень

ОсновыJuniorMiddleSenior

Воспроизведение по памяти бьёт перечитывание. Для каждого запроса скажите или запишите полный ответ из памяти, прежде чем открыть модельный, — именно усилие припоминания закрепляет ментальную модель агента.

Цель

Восстановить хребет юнита — цикл ReAct, почему стоимость контекста квадратична, набор выходов, нужных циклу, ловушку error recovery и выбор «скрипт или agent» — не подглядывая в урок.

Вспомните перед уходом

01
Опишите цикл агента ReAct в терминах «кто что делает» и укажите, что делает его «агентным».
02
Проведите коллегу через то, почему стоимость агента растёт квадратично с числом шагов и что переполняется на дальнем конце.
03
Почему жёсткий лимит шагов необходим, но недостаточен для безопасного termination, и что ещё добавляет сеньор?
04
Отдача ошибок инструмента модели — суперсила recovery цикла. Как она становится багом бесконечного цикла и как её ограничить?
05
Когда писать скрипт-поток вместо открытого агента и чего стоит агент, когда путь известен?
06
Назовите независимые выходы, которые должен иметь продакшен-цикл агента, и от чего защищает каждый.

Итог

Если вы смогли восстановить каждый ответ по памяти, вы держите хребет юнита: агент — это while-цикл, где модель выбирает действия, а ваш код их исполняет; стоимость квадратична, потому что весь транскрипт переотправляется каждый ход, а долгий прогон переполняет окно и роняет собственные инструкции; единственного выхода «модель остановилась» всегда мало, поэтому добавляют лимит шагов, бюджет wall-clock/токенов и dedup-проверку; error-feedback — суперсила recovery и ловушка runaway, ограниченная лимитом retry на инструмент; а известный путь скриптуют, берегя открытого агента для шагов, которые честно нельзя перечислить заранее. Теперь, получив агента на отладку или проектирование, вы знаете пять вопросов, которые нужно задать: сколько у цикла выходов, что ограничивает счёт в долларах, что обнаруживает thrash, что закрепляет инструкцию — и нужен ли этой задаче агент вообще?

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.