AI / LLM AI · 01 · 08

Prompt caching: тест на свободное припоминание

Промпты на свободное припоминание по всему юниту prompt caching. Сначала ответь своими словами, затем раскрой модельный ответ и сравни.

AI Senior ◷ 14 min

Уровень

ОсновыJuniorMiddleSenior

Припоминание бьёт перечитывание. На каждый промпт скажи или запиши полный ответ по памяти, прежде чем открыть модельный — усилие припоминания и закрепляет механизм.

Цель

Реконструируй ключевые механизмы юнита — сопоставление префикса токен-в-токен, экономику записи/чтения, выбор TTL, правило порядка и тихое отравление префикса — не подглядывая в урок.

Вспомните перед уходом

01
Почему prompt caching позиционное, а не семантическое, и что это значит для дизайна промпта?
02
Пройди по экономике записи/чтения и как выводится точка окупаемости.
03
Как работает TTL, когда 1-часовой тариф отбивает свою премию 2x, и как рассуждать о точке окупаемости между тарифами?
04
Что такое минимальная кэшируемая длина и в чём опасность пересечения её снизу?
05
Объясни тихое отравление префикса: как одна небрежная правка умножает счёт за вход на 10 без ошибки.
06
Что такое cache breakpoints и зачем их складывают на длинном слоёном промпте?

Итог

Если ты смог реконструировать каждый ответ по памяти — ты держишь хребет юнита: сопоставление позиционное и токен-в-токен с нулевой позиции, поэтому стабильный контент идёт первым, а волатильный последним, с breakpoint на финальном неизменном блоке. Платишь 1.25x один раз и 0.1x за чтение, так что кэш выигрывает после первого перечитывания внутри TTL — 5 минут по дефолту, 1 час для всплесков с паузами. Ниже минимальной кэшируемой длины модели ничего не кэшируется, тихо. А производственный режим отказа всегда один — отравление префикса у нулевого токена, видимое только в блоке usage. Теперь, когда соберёшься добавить что-нибудь в системный промпт — таймстамп, флаг, новый tool — первый вопрос будет: это идёт до или после breakpoint?

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.