AI / LLM AI · 03 · 08

RAG architecture: тест со свободным воспроизведением

Промпты на свободное воспроизведение по юниту RAG — компромиссы chunking, стоимость embedding, retrieval wide-then-narrow, lost-in-the-middle и abstain-gate. Сначала ответьте, потом откройте.

AI Senior ◷ 14 min

Уровень

ОсновыJuniorMiddleSenior

Воспроизведение из памяти бьёт перечитывание. Для каждого промпта реконструируйте полный ответ из памяти до того, как откроете модельный ответ — именно усилие припоминания закрепляет RAG-pipeline как ментальную модель.

Цель

Соберите по памяти хребет юнита — почему retrieval (а не генерация) доминирует среди сбоев, лезвие chunking, стоимость embedding, двухстадийная схема retrieve-then-rerank, порядок контекста и abstain-gate.

Вспомните перед уходом

01
Почему retrieval, а не генерация — доминирующий режим сбоя в продакшен-RAG, и что на самом деле делает промах retrieval?
02
Объясните лезвие chunking «размер vs recall» и роль overlap.
03
Как размерность embedding выступает рычагом стоимости и каков компромисс Matryoshka?
04
Опишите двухстадийную схему retrieve-wide-then-rerank-narrow и почему одного embedding top-k недостаточно.
05
Что такое lost-in-the-middle и как из-за этого собирать финальный контекст?
06
Что такое режим уверенной галлюцинации и как от него защититься (включая устаревший и отравленный индекс)?

Итог

Если вы реконструировали каждый ответ из памяти, у вас в руках хребет юнита: retrieval — а не генерация — место, где падает продакшен-RAG; chunking задаёт потолок (размер под смысловую единицу ответа, overlap ~10–15%); размерность embedding — усекаемый рычаг стоимости; разрыв recall-vs-precision решается схемой retrieve-wide-then-rerank-narrow; порядок контекста должен обходить lost-in-the-middle, ставя лучшие доказательства по краям; а режим уверенной галлюцинации — усугубляемый устаревшим и отравленным индексом — гасится gate по score, pipeline свежести и инструкцией отвечать только из контекста или отказываться.

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.