Деплой и инфра DEP · 04 · 07

Rollout strategies: обзор с выбором ответа

Синтез всего раздела в формате выбора — компромиссы стратегий, maxSurge/maxUnavailable, readiness probe, gate канарейки и безопасный для схемы rollback.

DEP Senior ◷ 14 min

Уровень

ОсновыJuniorMiddleSenior

Шесть вопросов, проходящих сквозь весь раздел. Каждый — это решение, которое вы принимаете во время реального релиза: не определение для пересказа, а компромисс, который надо взвесить, пока на сервис идёт трафик.

Цель

Убедитесь, что умеете связать выбор стратегии, knobs rolling update (maxSurge и maxUnavailable — параметры, управляющие скоростью и ёмкостью выката), readiness-гейтинг, метрические gate канарейки и безопасный для схемы rollback — тот синтез, к которому вёл обзорный урок.

Викторина

Платёжный API на Kubernetes выкатывает рискованный рефакторинг. У вас есть дашборды Prometheus, SLO-алерты и запас ёмкости кластера, и вы хотите минимально возможное влияние на пользователей, если что-то пойдёт не так. Какая стратегия и почему?

Викторина

Rolling update сообщает Deployment как 'available', все реплики подняты, однако ~30% запросов возвращают 502 в первые секунды после того, как каждый под входит в ротацию. В чём корневая причина?

Викторина

Команда хочет строгий zero-downtime на Deployment из 4 реплик, который никогда не должен падать ниже полной ёмкости. Какая конфигурация rolling update верна и чего она стоит? ```yaml strategy: type: RollingUpdate rollingUpdate: maxSurge: 1 maxUnavailable: 0 ```

Викторина

Вы используете blue-green и хотите, чтобы rollback оставался безопасным. Релиз green переименовывает колонку в БД. Что вы делаете?

Викторина

Canary-деплой наращивает 5%, затем 25%, затем 50% без метрического gate — инженер на глаз смотрит дашборд и вручную промоутит на каждом шаге. В 3 часа ночи релиз с 4% ошибок доезжает до 100%. В чём настоящий провал?

Викторина

Нужно выбрать выкат для сервиса, где две версии действительно не могут сосуществовать — in-place изменение stateful-синглтона без совместимой промежуточной схемы. Ёмкость в обрез, короткое окно обслуживания допустимо. Какая стратегия и какой компромисс вы принимаете?

Итог

Сквозная линия — одно решение: взвесить blast radius (радиус поражения: canary минимальный, recreate тотальный) против стоимости ресурсов (blue-green удваивает) против скорости rollback (blue-green и canary почти мгновенны, rolling катится назад, recreate — второй простой). Затем предпосылки, которые делают любой выбор реальным: maxSurge/maxUnavailable плюс readiness probe для zero-downtime rolling, автоматический метрический gate для canary и миграции expand-contract, чтобы rollback пережил изменение схемы. Observability решает, какой стратегии вы реально можете доверять. Теперь, когда столкнётесь со следующим решением о релизе, прогоните три оси до того, как потянетесь к дефолту — и убедитесь, что все предпосылки на месте до того, как деплой выходит в прод.

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.