AI / LLM
Агенты: тест на свободное воспроизведение
Воспроизведение по памяти бьёт перечитывание. Для каждого запроса скажите или запишите полный ответ из памяти, прежде чем открыть модельный, — именно усилие припоминания закрепляет ментальную модель агента.
Восстановить хребет юнита — цикл ReAct, почему стоимость контекста квадратична, набор выходов, нужных циклу, ловушку error recovery и выбор «скрипт или agent» — не подглядывая в урок.
- 01Опишите цикл агента ReAct в терминах «кто что делает» и укажите, что делает его «агентным».
- 02Проведите коллегу через то, почему стоимость агента растёт квадратично с числом шагов и что переполняется на дальнем конце.
- 03Почему жёсткий лимит шагов необходим, но недостаточен для безопасного termination, и что ещё добавляет сеньор?
- 04Отдача ошибок инструмента модели — суперсила recovery цикла. Как она становится багом бесконечного цикла и как её ограничить?
- 05Когда писать скрипт-поток вместо открытого агента и чего стоит агент, когда путь известен?
- 06Назовите независимые выходы, которые должен иметь продакшен-цикл агента, и от чего защищает каждый.
Если вы смогли восстановить каждый ответ по памяти, вы держите хребет юнита: агент — это while-цикл, где модель выбирает действия, а ваш код их исполняет; стоимость квадратична, потому что весь транскрипт переотправляется каждый ход, а долгий прогон переполняет окно и роняет собственные инструкции; единственного выхода «модель остановилась» всегда мало, поэтому добавляют лимит шагов, бюджет wall-clock/токенов и dedup-проверку; error-feedback — суперсила recovery и ловушка runaway, ограниченная лимитом retry на инструмент; а известный путь скриптуют, берегя открытого агента для шагов, которые честно нельзя перечислить заранее.