PostgreSQLSeniorTechnical

Как безопасно добавить колонку или индекс на большую таблицу без долгой блокировки?

Для безопасного добавления индекса используйте CREATE INDEX CONCURRENTLY. Для колонки с NOT NULL — добавить nullable, заполнить батчами, добавить CHECK NOT VALID, потом VALIDATE. Для FK — ADD CONSTRAINT ... NOT VALID, потом VALIDATE. Всегда выставляйте lock_timeout.

Почему это сложно

Большинство DDL-операций в PostgreSQL требуют AccessExclusiveLock — самую сильную блокировку, которая не совместима ни с чем. На таблице с миллионами строк и интенсивным трафиком такая блокировка может висеть минуты, полностью останавливая работу приложения.

Безопасное добавление колонки

С PostgreSQL 11+ добавление колонки с DEFAULT без VOLATILE функции не переписывает таблицу. Это безопасная операция с кратким lock.

-- PostgreSQL 11+: мгновенно, не переписывает строки
ALTER TABLE orders ADD COLUMN notes TEXT DEFAULT '';

-- PostgreSQL 10 и старше: DEFAULT переписывал всю таблицу!
-- Безопасный способ для старых версий:
ALTER TABLE orders ADD COLUMN notes TEXT;         -- без DEFAULT — быстро
UPDATE orders SET notes = '' WHERE notes IS NULL;  -- batch update
ALTER TABLE orders ALTER COLUMN notes SET DEFAULT '';
ALTER TABLE orders ALTER COLUMN notes SET NOT NULL; -- после заполнения всех строк

Добавление NOT NULL колонки — осторожно

-- ОПАСНО в старых версиях: переписывает всю таблицу
-- ALTER TABLE orders ADD COLUMN status TEXT NOT NULL DEFAULT 'pending';

-- Безопасный паттерн (PostgreSQL 12+ поддерживает NOT VALID constraint)
-- Шаг 1: добавить колонку nullable с DEFAULT
ALTER TABLE orders ADD COLUMN status TEXT DEFAULT 'pending';

-- Шаг 2: заполнить данные батчами, не блокируя таблицу
DO $$
DECLARE
  batch_size INT := 10000;
  last_id BIGINT := 0;
BEGIN
  LOOP
    UPDATE orders
    SET status = 'pending'
    WHERE id > last_id AND id <= last_id + batch_size AND status IS NULL;
    EXIT WHEN NOT FOUND;
    last_id := last_id + batch_size;
    PERFORM pg_sleep(0.01);  -- дать другим транзакциям шанс
  END LOOP;
END;
$$;

-- Шаг 3: добавить NOT NULL constraint (PostgreSQL 12+ проверяет через CHECK NOT VALID)
ALTER TABLE orders
  ADD CONSTRAINT orders_status_not_null CHECK (status IS NOT NULL) NOT VALID;
ALTER TABLE orders VALIDATE CONSTRAINT orders_status_not_null;  -- ShareUpdateExclusiveLock

Создание индекса без блокировки

-- ОПАСНО: обычный CREATE INDEX берёт ShareLock (блокирует writes)
-- CREATE INDEX idx_orders_user_id ON orders(user_id);

-- Безопасно: CONCURRENTLY делает два прохода, только ShareUpdateExclusiveLock
CREATE INDEX CONCURRENTLY idx_orders_user_id ON orders(user_id);

-- Уникальный индекс тоже можно
CREATE UNIQUE INDEX CONCURRENTLY idx_orders_external_id
  ON orders(external_id)
  WHERE external_id IS NOT NULL;

-- Если CONCURRENTLY упал (частично созданный «invalid» индекс):
SELECT indexname, indexdef
FROM pg_indexes
WHERE tablename = 'orders' AND indexname NOT IN (
  SELECT indexname FROM pg_indexes
  JOIN pg_index ON pg_index.indexrelid = (schemaname || '.' || indexname)::regclass
  WHERE indisvalid = true
);
-- Удалить невалидный и повторить:
DROP INDEX CONCURRENTLY idx_orders_user_id;
CREATE INDEX CONCURRENTLY idx_orders_user_id ON orders(user_id);

Добавление внешнего ключа

-- Обычный FK проверяет все существующие строки — долгий ShareRowExclusiveLock
-- ALTER TABLE orders ADD CONSTRAINT fk_user FOREIGN KEY (user_id) REFERENCES users(id);

-- Безопасный способ: сначала без проверки, потом validate отдельно
ALTER TABLE orders
  ADD CONSTRAINT fk_orders_user
  FOREIGN KEY (user_id) REFERENCES users(id)
  NOT VALID;            -- не проверяет существующие строки, берёт кратный lock

ALTER TABLE orders VALIDATE CONSTRAINT fk_orders_user;  -- ShareUpdateExclusiveLock

Переименование колонки и изменение типа

-- Переименование — кратко, но всё же AccessExclusiveLock
-- Используйте в окно обслуживания или zero-downtime через expand-contract:

-- 1. Добавить новую колонку
ALTER TABLE orders ADD COLUMN user_uuid UUID;

-- 2. Синхронизировать через триггер или приложение
-- 3. Переименовать старую в _deprecated, новую в правильное имя
-- 4. Удалить старую после деплоя всех сервисов

-- Изменение типа — почти всегда переписывает таблицу:
-- ALTER TABLE orders ALTER COLUMN amount TYPE NUMERIC(20,4);  -- ОПАСНО
-- Безопасно: новая колонка + migrate + переключение

Подводные камни

  • lock_timeout не выставлен. DDL без lock_timeout будет ждать сколько угодно, блокируя в очереди все последующие запросы. Всегда оборачивайте: SET lock_timeout = '2s'; ALTER TABLE ...; RESET lock_timeout;
  • CREATE INDEX CONCURRENTLY нельзя в транзакции. Запуск внутри BEGIN/COMMIT вызовет ошибку. Выполняйте вне транзакции.
  • CONCURRENTLY требует двух проходов. Это означает двойную нагрузку на I/O и занимает в 2–3 раза больше времени, чем обычный CREATE INDEX.
  • Невалидный индекс после прерванного CONCURRENTLY. Индекс создаётся в pg_indexes, но помечается как invalid. Он не используется планировщиком, но занимает место на диске. Нужно удалить и пересоздать.
  • ALTER TABLE в транзакции с другими операциями. Несколько DDL в одной транзакции могут накапливать блокировки и создавать deadlock.
  • Batch update без sleep. Массовый UPDATE без паузы между батчами создаёт непрерывную нагрузку на I/O и может нагнать autovacuum.
  • VALIDATE CONSTRAINT занимает время. Хотя он берёт более слабый ShareUpdateExclusiveLock, на очень большой таблице он всё равно может занять минуты — планируйте в период низкой нагрузки.

Common mistakes

  • Отвечать определением без production-сценария.
  • Не называть runtime boundary, security boundary или failure mode.
  • Игнорировать версию API, observability и тестовую проверку.

What the interviewer is testing

  • Объясняет механизм своими словами и без выдуманных API.
  • Называет реальные риски, диагностику и критерий корректности.
  • Связывает ответ с текущей документацией и миграционными ограничениями.

Sources

Related topics