awesome-everything EN
↑ Обратно к восхождению

AI / LLM

Streaming: повторение на припоминание

Суть Промпты на свободное припоминание по всему юниту streaming. Сначала ответь своими словами, затем открой модельный ответ и сравни.
Высота — путь к senior
НольJuniorMiddleSenior
Ты на senior-высоте — в орбите
◷ 14 min

Припоминание сильнее перечитывания. Для каждого промпта проговори или запиши полный ответ по памяти, прежде чем открыть модельный, — именно усилие припоминания закрепляет ментальную модель streaming.

Цель

Восстанови основные механизмы юнита — модель латентности TTFT, жизненный цикл SSE, накопление delta, контракт частичного JSON для tool, стратегию reconnect и отказ из-за буферизации — не заглядывая обратно в урок.

Вспомните перед уходом
  1. 01
    Почему streaming улучшает UX, не сокращая общее время генерации? Назови две метрики латентности, на которых он играет.
  2. 02
    Пройди жизненный цикл событий SSE для одного streamed-сообщения и скажи, что делаешь на каждом этапе.
  3. 03
    Почему аргументы tool-вызова нужно накапливать до парсинга и какой прод-баг возникает, когда промежуточный слой портит эти delta?
  4. 04
    Stream рвётся на 200-м токене из 400. Сравни полный resume через Last-Event-ID и прагматичный дефолт и скажи, что бы ты выкатил.
  5. 05
    Опиши прод-отказ №1 для streaming, его сигнатуру и конкретные фиксы.
  6. 06
    Почему reasoning-модель с chain-of-thought может заставить streaming-UI выглядеть зависшим и как это обработать?
Итог

Если ты смог восстановить каждый ответ по памяти, ты держишь хребет юнита: streaming меняет общее время на TTFT и читается по TPOT; SSE доставляет типизированный жизненный цикл, который ты накапливаешь в снапшот; text-delta рендерятся сразу, а фрагменты input_json_delta для tool парсятся только на content_block_stop, и пустые аргументы означают, что delta съел промежуточный слой; оборванные stream по умолчанию — повторяемые retry всего хода; TTFT reasoning-модели нужен UX-прогресс, а не фикс транспорта; а прод-убийца №1 — буферизующий прокси, превращающий TTFT обратно в общее время, чинится в конфиге пути, а не в приложении.

Продолжить восхождение ↑Streaming: чтение кода и потока
хоткеи развернуть
поиск
K
пред. пьеса
k
след. пьеса
j
тиры
t
это меню
?
sources3
expand
  1. 01
  2. 02
  3. 03

Trademarks belong to their respective owners. Editorial reference only.