AI / LLM AI · 08 · 08

Сборка LLM-приложений: тест на воспроизведение

Промпты на свободное воспроизведение поперёк всего трека AI/LLM. Сначала ответь по памяти, затем открой модельный ответ и сверься на швах между слоями.

AI Senior ◷ 14 min

Уровень

ОсновыJuniorMiddleSenior

Воспроизведение бьёт перечитывание. На каждый промпт восстанови полный ответ по памяти — поперёк всего трека, а не одного слоя — прежде чем открыть модельный. Усилие воспоминания и закрепляет рассуждение на уровне швов.

Цель

Восстанови хребет трека: как caching, RAG, streaming, tool calls, agent loop и evals собираются вместе — и где каждая пара корректных слоёв ломается на шве.

Вспомните перед уходом

01
Почему у RAG-ассистента с длинным статическим system-промптом cache hit rate в проде может быть почти нулевым и как это починить?
02
Почему стримящийся ход — это конечный автомат, а не труба токенов, и что будет, если это игнорировать?
03
Почему token-бюджетные алерты — не то же, что enforcement бюджета для агента, и как выглядит enforcement?
04
Почему зелёный офлайн eval-набор всё равно пропускает регрессию retrieval и как закрыть пробел?
05
Сформулируй тезис «баг живёт в шве» и как он меняет дебаг собранного LLM-приложения.
06
Пройди порядок, в котором ты дебажил бы собранный ассистент, у которого после выката утроилась стоимость и ответы кажутся медленнее.

Итог

Если смог восстановить каждый ответ по памяти, ты держишь хребет трека: caching — это байт-в-байт prefix match, поэтому динамический RAG-контекст — за брейкпойнтом; стрим — конечный автомат, где tool_use это переход, а каждый id должен быть спарен; agent loop’ам нужны enforced step/dollar-капы, а не алерты; evals обязаны гонять живой retrieval-путь, иначе регрессии retrieval уезжают зелёными. И мета-урок над всем: баг живёт в шве — трассируй один реальный запрос насквозь и моделируй весь поток. Теперь, когда встречаешь неожиданный всплеск стоимости или тихую регрессию после деплоя, ты ищешь проблему на границе между слоями, а не внутри компонента.

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.