Архитектура бэкенда BE · 02 · 05

DI как шов для тестов: фейки, моки и граница, которая важна

Весь смысл внедрения зависимостей — в шве, который оно создаёт: место, куда подставить тестовый дубль. Но есть два дубля с противоположными целями, и самая частая ошибка тестирования — мокать всё, пока тест не начнёт проверять реализацию вместо поведения.

BE Senior ◷ 16 min

Уровень

ОсновыJuniorMiddleSenior

Команда гордится набором тестов OrderService: 100% покрытия, каждая зависимость замокана, всё зелёное. Затем рефакторинг, ничего не меняющий в поведении — разбиение одного метода репозитория на два — делает сорок тестов красными. Тесты не проверяли, что заказы оформляются. Они проверяли, что repo.save вызван ровно один раз ровно с этими аргументами. Шов, который дал им DI, был реальным; они лишь нацелили его не туда.

Шов — это выигрыш

Всё в этом юните — внедрение через конструктор, корень композиции, абстракции вместо new — окупается здесь. Поскольку OrderService получает PaymentGateway, а не конструирует StripeClient, тест может передать замену. Эта замена — тестовый дубль, а точка внедрения — шов: стык, где продакшен-связывание меняется на тестовое. Нет шва — нет изолированного юнит-теста. Поэтому «тестируемо ли это?» и «внедрены ли зависимости?» — почти один вопрос.

Два дубля, противоположные цели

Слово «мок» используют вольно для любой замены, но различие — весь урок:

Стаб / фейк заменяет зависимость и поставляет состояние. Фейковый UserRepository на in-memory Map ведёт себя как реальный: сохранил пользователя — можешь прочитать обратно. Ваши проверки смотрят на результат — заказ оказался сохранён, возвращённая сумма верна.
Мок запрограммирован ожиданиями про вызовы. Он утверждает, что payment.charge(amount) вызван один раз с этим аргументом. Ваши проверки смотрят на взаимодействие, не на исход.

Первый проверяет, что система сделала; второй — как она это сделала. Оба легитимны, но падают по-разному — и Hook это то, что бывает, когда мок используют для того, что должен был покрыть фейк. Прежде чем потянуться за моком, спроси себя: сам ли вызов и есть наблюдаемый эффект? Если да — мок уместен. Если эффект — состояние, в котором оказывается система — используй фейк и проверяй исход.

Один и тот же шов DI, две противоположные задачи: фейк проверяет результирующее состояние и переживает рефакторинги, мок проверяет вызовы и ломается на любой смене формы вызова. Выбирай по тому, является ли сам вызов наблюдаемым эффектом.

Классицисты против лондонцев и почему это важно

Это раскол классицисты против мокистов («лондонская школа»). Мокисты мокают каждого коллаборатора и проверяют взаимодействия, так что каждый юнит тестируется в полной изоляции. Классицисты используют реальные объекты или фейки для коллабораторов, которыми владеют, и берегут моки для неудобных границ. Практическое следствие — связанность со структурой: полностью замоканный тест знает точную форму вызова своей зависимости, поэтому любой рефакторинг, сохраняющий поведение, но меняющий форму вызова, ломает тест. Это и есть баг сорока красных тестов. Тесты, проверяющие через состояние, переживают рефакторинги, ведь им важен лишь наблюдаемый результат.

▸Почему это работает

Почему тесты взаимодействий ломаются на рефакторингах, ничего не меняющих? Потому что ожидание мока есть утверждение о реализации. expect(repo.save).toHaveBeenCalledTimes(1) кодирует «продакшен-код вызывает save ровно один раз». Разбейте это на два save внутри транзакции — идентичное поведение, идентичное финальное состояние — и ожидание теперь ложно, хотя ничто наблюдаемое пользователем не изменилось. Тест мерил внутренние ходы кода, не его вывод. У тестов на состоянии этой проблемы нет: они спрашивают «после прогона заказ сохранён и сумма верна?», что инвариантно к любому рефакторингу, сохраняющему поведение. Моки не неправильны — они верный инструмент для проверки эффекта, который нельзя наблюдать через состояние, вроде «письмо отправлено» — но каждый мок это маленькая ставка, что именно эта форма вызова часть контракта.

Мокай на границе, фейкай то, чем владеешь

Дисциплина, избегающая чрезмерного мокания: мокай на краях системы, используй реальные объекты или фейки внутри неё. Код, которым владеешь и управляешь — доменные сервисы, твои репозитории — можно связать реальными экземплярами или in-memory-фейками, чтобы тесты упражняли настоящее взаимодействие. Мокать стоит границы, которыми не управляешь или которые не можешь позволить в тесте: платёжный шлюз, отправитель писем, часы, сторонний HTTP-вызов. Это ровно те зависимости, где хочешь утверждать «мы вызвали Stripe с этой суммой», ведь сам вызов и есть внешне видимый эффект. Шов ценнее всего именно на границе системы — где DI и важнее всего.

Шов также покупает порядки величины в скорости тестов, и именно поэтому он меняет то, как работает команда. In-memory-фейк репозитория на Map разрешает save-and-read за единицы микросекунд; тот же тест против реального Postgres — даже локального — платит за установку соединения плюс сетевой round-trip, обычно по 1–10мс, плюс очистку на каждый тест. Этот разрыв накапливается: набор из 500 юнит-тестов на фейках завершается заметно меньше чем за секунду и гоняется на каждое сохранение; те же 500 против реальной базы — это задача на секунды-минуты, которую запускаешь один раз перед пушем. DI — это то, что позволяет основной массе тестов оставаться на быстрых фейках, пока тонкий слой интеграционных тестов упражняет реальную границу — получаешь миллисекундный внутренний цикл и всё равно проверяешь связывание. Компромисс, в котором нужно быть честным: фейки могут дрейфовать от поведения реальной зависимости (in-memory-Map не обеспечит уникальный constraint и не покажет deadlock), поэтому быстрые фейки не заменяют небольшой набор тестов на реальной границе — они позволяют написать гораздо больше дешёвых.

Чрезмерное мокание — запах дизайна

Когда юнит-тесту нужно десять моков, чтобы сконструировать субъект, проблема не в тесте — в дизайне. Класс, требующий десять коллабораторов, делает слишком много, и болезненный тест — гонец. Рефлекс сеньора — читать боль теста как обратную связь о связанности, а не как повод тянуться за бо́льшим мок-арсеналом. Трудно тестировать обычно значит трудно менять.

Дубль	Поставляет	Вы проверяете	Ломается на
Фейк / стаб	Реалистичное состояние	Результат/исход	Только смена поведения
Мок	Записанные ожидания	Взаимодействие (вызовы)	Любая смена формы вызова
Реальный объект	Настоящее поведение	Результат/исход	Только смена поведения

Викторина

Сохраняющий поведение рефакторинг разбивает один `repo.save()` на два save внутри транзакции, и десятки тестов краснеют. Что это вскрывает о тех тестах?

Викторина

Какую зависимость лучше всего заменить моком, проверяющим вызов, а не фейком, поставляющим состояние?

Викторина

Юнит-тесту нужно десять моков лишь чтобы инстанцировать тестируемый класс. Каково сеньорское прочтение этой боли?

Шов — конструктор. Фейк проверяет состояние (заказ сохранён); мок проверяет вызов (charge вызван один раз с этой суммой). Использование мока там, где достаточно фейка, связывает тест с формой вызова и ломает его при любом структурном рефакторинге.

key takeaway

Выигрыш DI — шов: точка внедрения, где тест подставляет дубль. Фейк/стаб поставляет реалистичное состояние и даёт проверить исход, переживая любой рефакторинг, сохраняющий поведение. Мок записывает ожидания и проверяет взаимодействия, поэтому ломается при смене формы вызова — полезен лишь когда сам вызов и есть внешне видимый эффект. Дисциплина: мокай границы, которыми не управляешь (платёж, письма, часы), используй реальные объекты или фейки для своего кода, и читай «нужно десять моков» как запах дизайна, не пробел инструмента.

Вспомните перед уходом

01
Что такое шов для тестов и как DI его создаёт?
02
В чём разница между фейком/стабом и моком и как они падают по-разному?
03
Что за правило «мокай на границе, фейкай то, чем владеешь» и почему чрезмерное мокание сигналит проблему дизайна?

Итог

Шов, который создаёт внедрение зависимостей, — вся причина, по которой тестируемость и внедрение — один разговор: точка внедрения — это место, где продакшен-связывание уступает тестовому дублю. Но «дубль» прячет развилку. Фейк или стаб поставляет реалистичное состояние и даёт проверкам смотреть на исход, поэтому ломается лишь при настоящей смене поведения; мок записывает ожидания вызовов и проверяет взаимодействия, поэтому ломается на любом рефакторинге, меняющем форму вызова — причина того, что сохраняющее поведение изменение делает десятки тестов красными. Классицистская дисциплина держит тесты надёжными: мокай границы, которыми не владеешь (платёж, письма, часы, внешний HTTP), где сам вызов — видимый эффект, и связывай реальные объекты или фейки для кода, которым управляешь, проверяя через состояние. А когда тесту нужно десять моков лишь чтобы поставить субъект на ноги, боль — это дизайн говорит: слишком много коллабораторов, слишком много ответственности. С понятым швом последний урок поворачивает к тому, что делает реальный DI-контейнер в продакшене: графы разрешения, циклические зависимости, жадный старт и когда не использовать контейнер вовсе. Теперь, когда рефакторинг покрасит десятки тестов несмотря на неизменное поведение, — диагноз ясен: тесты проверяли формы вызовов, а не исходы; фикс — заменить моки на фейки и проверять через состояние.

Практика

Начни сверху. Задачи идут от простого к сложному: вспомнить факт, применить к случаю, затем senior-уровень. Открой, попробуй, потом открой ответ.

вспомнитьприменитьуглубить0 из 5 завершено

Связанные уроки

опирается на

Скоупы и время жизни DI: singleton, request, transientmiddle

открывает

DI-контейнеры в продакшене: графы разрешения, циклы и когда не стоитsenior

углубляется в

DI-контейнеры в продакшене: графы разрешения, циклы и когда не стоитsenior

встречается в188

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.