Базы данных DB · 01 · 02

Ограничения, ключи и типы данных Postgres

Пять видов ограничений в деталях, суррогатные vs натуральные ключи, разрыв SQL с реляционной алгеброй и почему выбор минимального типа Postgres — тоже ограничение.

DB Middle ◷ 16 min

Уровень

ОсновыJuniorMiddleSenior

Команда хранит деньги в REAL. После года накопленных транзакций обнаруживаются расхождения на уровне центов, которые невозможно объяснить. Тип и был ошибкой — арифметика float теряет точность. Исправление — изменение схемы, затрагивающее каждую строку.

Реляционная модель Кодда vs SQL

Статья Эдгара Кодда 1970 года формализовала отношения как наборы кортежей из типизированных доменов и определила замкнутую алгебру операций (выборка, проекция, соединение, объединение, пересечение, разность) — замкнутую потому, что каждая операция принимает отношения на вход и возвращает отношение на выход. SQL — нестрогая реализация этой алгебры; он добавляет NULL (что Кодду не нравилось), ORDER (строки концептуально неупорядочены) и дублирующиеся строки (в отношениях дублей нет). Знание этого разрыва объясняет шероховатости:

NULL = NULL — это NULL, не true: трёхзначная логика.
ORDER BY обязателен для гарантии порядка строк — без него движок вернёт любой порядок.
DISTINCT существует потому, что движок должен хранить дубли, пока вы не попросите иначе.

Воспринимайте разрыв как «SQL = реляционная алгебра плюс практические компромиссы» — и неожиданности перестанут удивлять.

Пять видов ограничений

Зачем держать все пять в голове? Потому что каждый из них отсекает отдельный класс багов прямо при записи — до того, как плохие данные попадут в приложение. Когда в продакшне обнаруживается несогласованность данных, спроси себя: какое из этих пяти ограничений её бы предотвратило?

Ограничение	Что принудительно соблюдает	Ключевая деталь
PRIMARY KEY	Уникальный ненулевой идентификатор строки	Один на таблицу; неявно создаёт уникальный B-tree индекс
UNIQUE	Нет дублей в наборе колонок	Несколько NULL допустимы (стандарт SQL); `UNIQUE NULLS NOT DISTINCT` (SQL:2023 / Postgres 15+) запрещает это
NOT NULL	Колонка всегда имеет значение	Для каждой колонки; первый рубеж качества данных
FOREIGN KEY	Колонка ссылается на существующий PK/UNIQUE другой таблицы	Параметры ON DELETE / ON UPDATE: NO ACTION, RESTRICT, CASCADE, SET NULL, SET DEFAULT
CHECK	Произвольное булево выражение на каждой строке при записи	`CHECK (amount >= 0)`, `CHECK (status IN (‘open’,‘closed’))` — может ссылаться на другие колонки той же строки

Суррогатные vs натуральные ключи

Натуральный ключ — данные, уже существующие в бизнес-домене (email пользователя, SKU продукта, номер заказа). Суррогатный ключ — генерируемый базой, непрозрачный, значимый только внутри базы (BIGSERIAL, UUID).

Продакшн-дефолт в 2026: суррогатный ключ как primary key плюс ограничение UNIQUE NOT NULL на бизнес-натуральный ключ. Почему: натуральные ключи меняются (клиент меняет email), а изменение primary key каскадирует через каждый ссылающийся foreign key — операционно дорогостояще и часто невозможно при масштабе. Суррогатные ключи никогда не меняются.

Исключение: чистые join-таблицы (favourites: user_id, item_id) часто используют композит из foreign keys как PK — сама связь и есть идентичность, суррогат не нужен.

UUID vs BIGSERIAL. UUID глобально уникальны (хороши для распределённых вставок, мультирегионов, offline-first клиентов), но больше (16 байт против 8) и хуже для локальности индекса (случайные UUIDv4 фрагментируют B-tree). UUIDv7 (упорядоченный по времени, RFC 9562) решает проблему локальности и является современным дефолтом там, где нужен UUID. BIGSERIAL меньше, последователен и cache-friendly — выбирайте его, когда глобально уникальные ID не нужны.

Компромисс суррогатного ключа в одном числе: UUID покупает глобальную уникальность ценой вдвое большего числа байт на запись индекса по сравнению с BIGSERIAL, плюс худшая локальность B-tree, если не использовать упорядоченный по времени UUIDv7.

Типы данных Postgres: выбирайте минимально необходимый

У Postgres богатейшая система типов среди всех популярных баз данных. Тип — первый рубеж ограничения: правильно типизированная колонка отсекает 80% плохих данных до того, как сработает любое CHECK ограничение.

Категория	Продакшн-дефолты	Избегать
Целые	BIGINT (8B) для ID; INTEGER (4B) при ограниченном домене < ~2B	SMALLINT без уверенности, что < 32 767
Строки	TEXT (без ограничения длины, без padding)	CHAR(n) — padding до длины, сюрпризы с пробелами; VARCHAR(n) добавляет проверку, но не даёт выигрыша в хранении
Деньги	NUMERIC(p,s) или BIGINT cents — точная арифметика	REAL или DOUBLE PRECISION — IEEE 754 теряет центы
Время	TIMESTAMPTZ (хранит UTC, отображает в timezone сессии)	TIMESTAMP (без зоны) — ловушка; DATE для дат
ID	UUID нативный тип (16 байт)	UUID как TEXT — тратит байты, теряет принудительный тип
Булевы	BOOLEAN	SMALLINT или TEXT для булевых — семантически неверно
Полуструктурированные	JSONB (бинарный, индексируемый)	JSON (только текст, не индексируемый)

Числа по ключам и типам

Статья Кодда: 1970
BIGSERIAL на запись в индексе: 8 байт
UUID на запись в индексе: 16 байт
UUIDv7 vs UUIDv4 локальность индекса: упорядоченный vs случайный
Overhead проверки FK-ограничения: ~5-50 мкс / строка
Размер GIN-индекса JSONB vs B-tree: ~5-20x больше
Типичный overhead хранения колонки: ~1-4 байта / колонка
Размер записи составного PK в индексе: ~24-48 байт

Спроектируйте минимальную e-commerce схему (users, products, orders)

1/3

Викторина

Команда хранит деньги в REAL и обнаруживает расхождения на уровне центов после года транзакций. Исправление?

Викторина

Какой самый весомый аргумент в пользу суррогатного primary key (BIGSERIAL или UUID) перед натуральным (email)?

ON DELETE выбирается под каждую связь: RESTRICT запрещает удалять родителя, у которого ещё есть дочерние строки; CASCADE удаляет принадлежащие ему строки. Составной PK у order_items делает саму связь её идентичностью.

Вспомните перед уходом

01
Почему NULL = NULL не TRUE в SQL и чему это равно?
02
Назовите параметры ON DELETE для foreign key и когда каждый используется.
03
Что является продакшн-дефолтом для хранения валюты в Postgres и почему не REAL?

Итог

SQL — это реляционная алгебра плюс практические компромиссы: NULL, порядок и дубли. Пять видов ограничений (PRIMARY KEY, FOREIGN KEY, NOT NULL, UNIQUE, CHECK) кодируют бизнес-правила, которые движок не нарушает. Продакшн-дефолт для primary keys — суррогатный (BIGSERIAL или UUIDv7) плюс UNIQUE NOT NULL на бизнес-натуральный ключ: натуральные ключи меняются, суррогатные — никогда. Типы Postgres — первый рубеж ограничений: NUMERIC для денег, TIMESTAMPTZ для временных меток, TEXT для строк, JSONB (не JSON) для полуструктурированных данных. Теперь, когда увидишь колонку с деньгами в REAL или временную метку без timezone — ты будешь знать точно, какой дрейф накапливается и какие типы использовать вместо них. Урок 3 разбирает нормализацию — дисциплину удаления избыточности из схемы.

Практика

Начни сверху. Задачи идут от простого к сложному: вспомнить факт, применить к случаю, затем senior-уровень. Открой, попробуй, потом открой ответ.

вспомнитьприменитьуглубить0 из 5 завершено

Связанные уроки

опирается на

Что такое отношение: таблицы, строки, ключи и ограниченияjunior

открывает

Нормальные формы, денормализация и почему схемы «прилипают»middle

углубляется в

встречается в190

Что-то непонятно?

Задай вопрос по этому уроку. Вопросы анонимны и попадают напрямую автору — урок станет лучше.

Примени это

Примени этот урок в реальном проекте.

Мини-CRUD APIСобери свой первый настоящий бэкенд: крошечный HTTP API, который создаёт, читает, обновляет и удаляет заметки — на SQLite, чтобы данные пережили перезапуск. Ты пройдёшь путь от сервера в одну строку с «hello» до небольшого сервиса, который проверяет ввод и хранит строки, — честно, шаг за шагом.URL-сокращатель под нагрузкойСобери URL-сокращатель, который выдерживает настоящий трафик, — а потом эксплуатируй его: задеплой, наблюдай и разберись с инцидентом, когда одна горячая ссылка плавит твой кэш.