awesome-everything EN
↑ Обратно к восхождению

AI / LLM

Prompt caching: тест на свободное припоминание

Суть Промпты на свободное припоминание по всему юниту prompt caching. Сначала ответь своими словами, затем раскрой модельный ответ и сравни.
Высота — путь к senior
НольJuniorMiddleSenior
Ты на senior-высоте — в орбите
◷ 14 min

Припоминание бьёт перечитывание. На каждый промпт скажи или запиши полный ответ по памяти, прежде чем открыть модельный — усилие припоминания и закрепляет механизм.

Цель

Реконструируй ключевые механизмы юнита — сопоставление префикса токен-в-токен, экономику записи/чтения, выбор TTL, правило порядка и тихое отравление префикса — не подглядывая в урок.

Вспомните перед уходом
  1. 01
    Почему prompt caching позиционное, а не семантическое, и что это значит для дизайна промпта?
  2. 02
    Пройди по экономике записи/чтения и как выводится точка окупаемости.
  3. 03
    Как работает TTL, когда 1-часовой тариф отбивает свою премию 2x, и как рассуждать о точке окупаемости между тарифами?
  4. 04
    Что такое минимальная кэшируемая длина и в чём опасность пересечения её снизу?
  5. 05
    Объясни тихое отравление префикса: как одна небрежная правка умножает счёт за вход на 10 без ошибки.
  6. 06
    Что такое cache breakpoints и зачем их складывают на длинном слоёном промпте?
Итог

Если ты смог реконструировать каждый ответ по памяти — ты держишь хребет юнита: сопоставление позиционное и токен-в-токен с нулевой позиции, поэтому стабильный контент идёт первым, а волатильный последним, с breakpoint на финальном неизменном блоке. Платишь 1.25x один раз и 0.1x за чтение, так что кэш выигрывает после первого перечитывания внутри TTL — 5 минут по дефолту, 1 час для всплесков с паузами. Ниже минимальной кэшируемой длины модели ничего не кэшируется, тихо. А производственный режим отказа всегда один — отравление префикса у нулевого токена, видимое только в блоке usage.

Продолжить восхождение ↑Prompt caching: чтение запроса и usage
хоткеи развернуть
поиск
K
пред. пьеса
k
след. пьеса
j
тиры
t
это меню
?
sources2
expand
  1. 01
  2. 02

Trademarks belong to their respective owners. Editorial reference only.