Базы данных DB · 03 · 03

Алгоритмы соединения и каскад ошибок оценки строк

Postgres выбирает Nested Loop, Hash Join или Merge Join на основе оценок строк. Когда внешняя сторона недооценена в 1000×, Nested Loop взрывается — алгоритм является симптомом, а плохая оценка строк — причиной.

DB Middle ◷ 16 min

Уровень

ОсновыJuniorMiddleSenior

Запрос возвращает 50 строк за 50 мс на staging. В production — та же схема, идентичные индексы, тот же запрос — 4.2 секунды. EXPLAIN ANALYZE показывает Nested Loop ... loops=520000. Внутренний index scan выполнился полмиллиона раз. Планировщик думал, что на внешней стороне 50 строк. Их было 520,000. Одна плохая оценка. Один неверный выбор соединения. Замедление в 80×.

Три алгоритма соединения

Алгоритм	Форма стоимости	Побеждает когда	Опасность
Nested Loop	outer_rows × inner_cost	Внешняя сторона мала (десятки строк), внутренняя имеет индекс	Взрывается при недооценке внешней стороны как малой
Hash Join	build_cost + probe_cost	Средние и большие equi-join; ни одна сторона не имеет индекса на ключе сортировки	Сбрасывается на диск, если хеш-таблица превышает work_mem
Merge Join	sort_cost + merge_cost	Обе стороны уже отсортированы (подходящий индекс); большие equi-join	Требует отсортированного ввода; сортировка может сброситься при малом work_mem

Nested Loop

Для каждой строки внешнего отношения ищет совпадающие строки во внутреннем — как правило, через индекс. Стоимость: outer_rows × inner_cost_per_lookup. Побеждает, когда внешняя сторона мала (десятки строк), потому что стоимость внутреннего поиска по индексу уплачивается столько же раз. Катастрофически проигрывает при недооценке внешней стороны: если планировщик думает, что внешних строк 10, а их 10,000, внутренний поиск выполняется 10,000 раз вместо 10 — в 1000× больше работы.

Диагностика: счётчик loops на внутреннем узле. В здоровом Nested Loop: loops=50. В «взорвавшемся»: loops=520000.

Hash Join

Строит хеш-таблицу из меньшей (build) стороны, затем проверяет её строками из большей (probe) стороны. Стоимость: build + probe. Побеждает для средних и больших equi-join, где ни одна сторона не имеет индекса, выровненного по ключу соединения. Критический параметр — work_mem: хеш-таблица должна помещаться в памяти. Когда нет, Hash Batches превышает 1 и таблица сбрасывается на диск — ищите Batches: 64 или аналогичное в выводе плана. Исправление: SET work_mem = '64MB' для сессии (не глобально, без учёта max_connections).

Merge Join

Сортирует обе стороны по ключу соединения (или использует индексы, уже обеспечивающие порядок), затем сливает параллельно. Побеждает, когда обе стороны приходят отсортированными — например, при соединении двух таблиц с ORDER BY id и соответствующими индексами. Не добавляет дополнительной стоимости сортировки. Полезен для range join и когда порядок сортировки нужен и для финального результата.

Каскад ошибок оценки строк

Это самая важная концепция урока — и та, которую большинство инженеров упускает, пытаясь исправить производительность соединений через алгоритмы вместо статистики. Плохая оценка строк на одном узле плана каскадирует на каждый узел выше:

Планировщик думает, что фильтр WHERE country='US' AND region='CA' AND status='shipped' вернёт 50 строк (независимые вероятности: 50% × 5% × 20% = 0.5%)
Планировщик выбирает Nested Loop — дёшево когда внешняя сторона мала
Реальность: колонки коррелированы (все CA-заказы в US), реальная селективность 5% × 20% = 1% — и планировщик ошибся с кардинальностью индекса; реальных строк = 520,000
Внутренний index scan выполняется 520,000 раз вместо 50 — в 10,400× больше работы

Все четыре шага вместе означают, что одно неверное умножение вероятностей на шаге 1 портит каждое решение выше; без правильного шага 1 шаги 2–4 гарантированно будут неверными. Неверный алгоритм (Nested Loop вместо Hash Join) — симптом. Неверная оценка строк — причина. Принудительный выбор алгоритма (например, SET enable_nestloop = off) маскирует симптом, оставляя корень причины. Исправьте оценку — выбор алгоритма последует.

Планировщик предсказал 50 внешних строк; реальность — 520,000. Именно этот разрыв в оценке, а не алгоритм, вызывает взрыв с 50 мс до 4.2 с.

Несаргабельные предикаты

Предикат «саргабелен» (Search ARGument-ABLE), если планировщик может использовать индекс для его вычисления. Несаргабельные предикаты принудительно вызывают Seq Scan и искажают оценки строк.

Типичные нарушители:

WHERE LOWER(email) = 'alice@x.com' — функция на индексируемой колонке → используйте выражаемый индекс CREATE INDEX ON users (LOWER(email))
WHERE created_at::date = '2026-01-01' — приведение типа → перепишите как WHERE created_at >= '2026-01-01' AND created_at < '2026-01-02'
WHERE EXTRACT(year FROM created_at) = 2026 — вызов функции → тот же диапазонный рефактор
WHERE id::text = '42' — неявное приведение → WHERE id = 42 (исправьте тип в приложении)
WHERE name LIKE '%foo' — лидирующий wildcard → GIN-индекс pg_trgm для нечёткого поиска

EXPLAIN сразу это обнаруживает: Seq Scan + Filter там, где ожидался Index Scan. Строка Filter показывает, что применялось после сканирования, а не до — то есть индекс не помог.

Диагностика и исправление взрыва оценки строк

1/3

Викторина

EXPLAIN ANALYZE показывает `Nested Loop (cost=0..50 rows=10) ... -> Index Scan ... (loops=10000)`. Какова наиболее вероятная причина?

Викторина

В плане запроса показано `Hash Join ... Hash Batches: 64`. Что это означает и каково исправление?

Викторина

Какой предикат является НЕСАРГАБЕЛЬНЫМ и вызовет последовательное сканирование, даже если на `created_at` есть индекс?

Неверный алгоритм — это симптом; причина — плохая оценка внешних строк. Исправьте оценку (ANALYZE, расширенная статистика) — и планировщик перестанет выбирать Nested Loop.

Вспомните перед уходом

01
Объясните каскад ошибок оценки строк: почему плохая оценка на одном узле ломает весь план выше него?
02
Когда Hash Join является правильным выбором и что заставляет его сбрасываться на диск?
03
Что такое несаргабельный предикат, почему он важен для производительности и как исправить типичные случаи?

Итог

Postgres выбирает среди трёх алгоритмов соединения: Nested Loop (outer_rows × inner_cost, побеждает при малых внешних с внутренним индексом), Hash Join (построить хеш-таблицу + проверить, побеждает для средних и больших equi-join, сбрасывается на диск когда хеш-таблица превышает work_mem), Merge Join (сортировать обе стороны, слить параллельно, побеждает когда обе стороны приходят отсортированными). Выбор алгоритма определяется оценками строк на каждом узле — недооценка в 1000× на внешней стороне Nested Loop превращает внутренний поиск в 1000× больше работы, чем запланировано. Неверный алгоритм всегда симптом; неверная оценка строк всегда причина. Исправляйте оценки (ANALYZE, расширенная статистика) и выбор алгоритма скорректируется сам. Несаргабельные предикаты (функции на индексируемых колонках, неявные приведения) предотвращают использование индекса и искажают оценки — перепишите их как диапазонные предикаты или добавьте выражаемые индексы. Теперь, когда увидишь loops= в тысячах на внутреннем узле, следующий шаг — не отключать Nested Loop, а искать, почему так неверна оценка внешней стороны.

Практика

Начни сверху. Задачи идут от простого к сложному: вспомнить факт, применить к случаю, затем senior-уровень. Открой, попробуй, потом открой ответ.

вспомнитьприменитьуглубить0 из 8 завершено

Связанные уроки

опирается на

Типы сканирования: Seq, Index, Bitmap, Index-Onlymiddle

открывает

углубляется в

встречается в177

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.

Примени это

Примени этот урок в реальном проекте.

Визуализатор планов запросовВставь EXPLAIN (ANALYZE, FORMAT JSON) и отрисуй дерево плана с таймингом по узлам и ошибкой оценки строк, чтобы плохой join был виден сразу.