Архитектура бэкенда BE · 04 · 07

Пулинг: тест с множественным выбором

Синтез с множественным выбором по юниту пулинга — формула размера, acquisition timeout, мёртвые соединения, leak vs exhaustion и fan-in против max_connections.

BE Senior ◷ 13 min

Уровень

ОсновыJuniorMiddleSenior

Шесть вопросов, пронизывающих весь юнит. Каждый отражает решение, которое ты принимаешь в реальном инциденте с пулингом — не определение для пересказа, а компромисс, который надо взвесить, когда pool пуст, течёт или сходится (fan-in) в одну общую базу.

Цель

Убедись, что можешь связать pool size, acquisition timeout, жизненный цикл соединения, leaks и распределённый fan-in — синтез, к которому вели отдельные уроки.

Викторина

Команда делает базу узким местом и поднимает pool с 20 до 100 на 8-ядерном Postgres, ожидая примерно 5x пропускной способности. Пропускная способность падает, задержка растёт. Почему?

Викторина

Запрос вниз по стеку, обычно занимающий 5 мс, замедляется до 500 мс; за секунды весь веб-слой перестаёт принимать запросы, хотя база всё ещё жива. Каков механизм и первый конфиг-фикс?

Викторина

После ночного затишья первые утренние запросы падают с 'connection reset by peer'; ничего не деплоили, база здорова. Что произошло и какой контроль — корневая защита?

Викторина

Сервис таймаутит на acquisition соединений после часов работы; рестарт чинит на несколько часов, затем повторяется, и всё это при нормальном трафике. Почему увеличение pool — неверный фикс?

Викторина

Хендлер берёт соединение из pool, затем await'ит медленный внешний HTTP-вызов до своего запроса. Ничего не течёт — try/finally всегда освобождает. Почему это всё равно истощает pool под нагрузкой?

Викторина

Сервис, здоровый на одном инстансе (pool 20), начинает кидать 'FATAL: sorry, too many clients already' после автоскейла до 50 инстансов. Утечек pool нет. Каков фикс и его главная цена корректности?

Итог

Сквозная линия юнита — одна цепочка: pool амортизирует setup соединения и ограничивает конкурентность, поэтому его размер мал и выведен из ядер (а не угадан большим); когда он пустеет, acquisition timeout решает, упадёшь ли ты быстро или заморишь веб-слой; удерживаемые им соединения протухают и должны ротироваться по maxLifetime и валидироваться on borrow; самый частый отказ — leak (или hoarding через await), который больший pool лишь оттягивает и прячет; а на масштабе многие pool сходятся в один max_connections, вынуждая transaction-pooling мультиплексор, торгующий состоянием сессии. Каждый ответ возвращается к одной дисциплине — ограничивай ресурс осознанно (size, wait, age, return, fan-in), а не позволяй внешней системе ограничить его за тебя в худший момент.

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.