Кеширование CACHE · 03 · 04

Stale-while-revalidate и CDN request coalescing

Директива stale-while-revalidate из RFC 5861 немедленно возвращает устаревшее значение из кеша, обновляясь в фоне — полностью устраняя ожидание. CDN расширяет это с request coalescing, который форвардит ровно один origin-запрос на каждый cache miss.

CACHE Middle ◷ 12 min

Уровень

ОсновыJuniorMiddleSenior

Lock-based кеш даёт 10 000 ожидающим запросам одно из двух: перестроенное значение (после 400 мс ожидания) или fallback. Stale-while-revalidate немедленно даёт всем 10 000 ожидающим старое значение — и ставит в очередь ровно один фоновый refresh. Ноль ожидания, ноль спайка БД.

RFC 5861: стандарт

Прежде чем браться за SWR, спроси себя: допускает ли моя данная быть устаревшей на N секунд? Если да — SWR даёт нулевое ожидание на TTL-границах бесплатно: никакой инфраструктуры локов, никакого вероятностного кода, только одна директива заголовка.

RFC 5861 (2010) определяет два расширения Cache-Control:

stale-while-revalidate=N — отдавать устаревший (истёкший) кешированный ответ до N секунд, инициируя фоновую ревалидацию. Пользователь видит ответ без ожидания.
stale-if-error=N — отдавать устаревший кешированный ответ до N секунд, если ревалидация падает (5xx, таймаут). Держит сайт доступным при сбоях origin.

Пример заголовка:

Cache-Control: max-age=60, stale-while-revalidate=30, stale-if-error=3600

Это означает: свежий 60 с, отдавать stale ещё 30 с при фоновом обновлении, отдавать stale до 1 часа при ошибке origin.

Что происходит на истечении TTL

С включённым SWR на кеше (CDN или application-level):

T=60.0 с — TTL срабатывает. Ключ теперь «устаревший, но в рамках stale-while-revalidate».
Запросы 1–N приходят в T=60.001 с.
Все N запросов немедленно получают stale-значение. Без ожидания.
В очередь ставится ровно один фоновый refresh (кеш выбирает первый запрос или использует отдельный background task).
T=60.4 с — фоновый refresh завершается. Новое значение сохранено.
Будущие запросы получают свежее значение.

Нагрузка на БД на границе: 1 запрос, не N.

Митигация	Ожидание пользователя на TTL-границе	Запросы к БД на границе
Нет (наивный TTL)	Нет — но БД падает	N параллельных
Только лок	До rebuild p99 (ожидающие в очереди)	1 (сериализованный)
Single-flight	До rebuild p99 (подписчики ждут)	1 на ноду
XFetch	Нет — кеш никогда не истекает под трафиком	~1 (ранний rebuild)
SWR	Нет — stale отдаётся немедленно	1 (фоновый)

SWR — единственный квадрант, не платящий ни одной цены: каждый читатель получает мгновенный ответ, а БД видит ровно один rebuild. Локи меняют ожидание на безопасность; наивный TTL меняет БД на скорость.

Компромисс: ограниченный staleness

SWR явно принимает, что читатели будут видеть устаревшие данные до stale-while-revalidate длительности после истечения max-age. Это нормально для:

Контент-страниц, новостных лент, product listings
Баннеров главной страницы, навигационных меню
Любых данных, где лаг 30–300 с незаметен пользователям

Это неправильно для:

Баланса счёта, счётчиков голосов, всего, что влияет на бизнес-решения в реальном времени
Всего, где два пользователя должны видеть согласованное состояние одновременно

CDN-уровень: request coalescing

CDN расширяют SWR с request coalescing (объединение запросов, Cloudflare) или request collapsing (Fastly). Когда cache miss приходит на edge:

Edge входит в состояние «stitching» — он выпустил один upstream fetch и ждёт ответа.
Любые дополнительные запросы на тот же путь в состоянии «stitching» не генерируют дополнительных upstream fetch.
Все ожидающие запросы получают ответ одновременно, когда единственный upstream fetch завершается.

Вирусный контент-event с 10 миллионами зрителей, хитящими один URL, производит один origin-fetch, не 10 миллионов. Cloudflare и Fastly публикуют, что request coalescing превращает sudden-traffic инциденты в low-impact события на origin.

Framework-уровень: Next.js ISR

Next.js Incremental Static Regeneration (ISR) — SWR на уровне фреймворка. Страница с revalidate: 60 обслуживается из кеша 60 секунд; первый запрос после revalidate-окна триггерит фоновую регенерацию, пока stale-страница продолжает обслуживать. Форма идентична RFC 5861 — фреймворк просто реализует это без HTTP Cache-Control заголовков.

▸Почему это работает

Кеширование GraphQL в Apollo использует SWR-семантику для нормализованных cache-записей. Результат запроса отдаётся из нормализованного кеша, пока фоновый refetch сверяет устаревшие поля. Тот же принцип распространяется на gRPC response caching и даже DNS TTL — паттерн «отдать stale, обновить в фоне» универсален везде, где существуют TTL-based кеши.

Викторина

В T=60.001 с приходит 2 000 запросов для ключа с TTL=60 с и stale-while-revalidate=30 с. Сколько из них ждут завершения rebuild?

Викторина

Какой use case НЕПОДХОДЯЩИЙ для stale-while-revalidate?

Викторина

На CDN edge срабатывает Cloudflare request coalescing во время вирусного события. 50 000 одновременных запросов приходят на один URL, который только что истёк. Сколько upstream origin-запросов делается?

Каждый читатель получает stale-значение с нулевым ожиданием; кеш запускает ровно один фоновый refresh к origin. Нагрузка на БД на границе — 1, а не N.

Вспомните перед уходом

01
Что означает на практике HTTP заголовок Cache-Control: max-age=60, stale-while-revalidate=30, stale-if-error=3600?
02
Как Next.js ISR реализует ту же гарантию, что RFC 5861 stale-while-revalidate?

Итог

Stale-while-revalidate (RFC 5861) устраняет очереди ожидания на TTL-границах, немедленно возвращая stale-значение всем запросам и запуская ровно один фоновый refresh. Пользовательская латентность на границе падает до нуля; нагрузка на БД падает до одного rebuild-запроса. CDN-level request coalescing расширяет тот же принцип глобально: edge выпускает один origin-fetch на cache miss-событие независимо от числа параллельных запросов. Компромисс — явный ограниченный staleness, приемлемый для контента, неподходящий для strong-consistent бизнес-данных. Комбинируй SWR на CDN edge с XFetch или распределённым локом на application cache-слое для defence-in-depth на каждом тире. Теперь, когда проверяешь дизайн кеширования, — первым делом спрашивай: допустим ли staleness? Если да, одна директива заголовка даёт тебе нулевое ожидание на TTL-границах.

Практика

Начни сверху. Задачи идут от простого к сложному: вспомнить факт, применить к случаю, затем senior-уровень. Открой, попробуй, потом открой ответ.

вспомнитьприменитьуглубить0 из 5 завершено

Связанные уроки

опирается на

XFetch: вероятностное раннее истечение без координацииmiddle

открывает

Детектирование stampede и дизайн TTL для продакшенаmiddle

углубляется в

Детектирование stampede и дизайн TTL для продакшенаmiddle

встречается в228

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.