В чём разница между UNION и UNION ALL?
UNION объединяет результаты двух запросов и удаляет дубликаты (сортировка + дедупликация). UNION ALL включает все строки включая дубликаты и работает быстрее, так как не выполняет сортировку.
UNION и UNION ALL в MySQL
Оба оператора объединяют результирующие наборы двух и более SELECT-запросов в один. Требования: одинаковое количество столбцов в каждом запросе и совместимые типы данных в соответствующих позициях.
UNION — с дедупликацией
MySQL сортирует объединённый результат и удаляет строки-дубликаты. Это дороже по ресурсам.
-- Все уникальные email-адреса из двух таблиц
SELECT email FROM customers
UNION
SELECT email FROM partners;
-- Дублирующиеся email встречаются только один раз
UNION ALL — без дедупликации
Все строки из обоих запросов включаются в результат как есть. Нет сортировки, нет проверки дублей — значительно быстрее.
-- Все транзакции из двух источников (дубли допустимы)
SELECT id, amount, created_at, 'income' AS type FROM income_tx
UNION ALL
SELECT id, amount, created_at, 'expense' AS type FROM expense_tx
ORDER BY created_at DESC
LIMIT 50;
Практический пример: единый лог событий
SELECT
'order' AS entity_type,
id AS entity_id,
created_at AS event_time,
status AS detail
FROM orders
WHERE user_id = 42
UNION ALL
SELECT
'payment' AS entity_type,
id AS entity_id,
created_at AS event_time,
CAST(amount AS CHAR) AS detail
FROM payments
WHERE user_id = 42
ORDER BY event_time DESC;
Сравнение производительности
- UNION: материализует временную таблицу, сортирует её, удаляет дубли — O(N log N) по памяти и CPU.
- UNION ALL: потоковая передача строк без дополнительных операций — O(N).
Используйте UNION ALL всегда, когда дубликаты логически невозможны (разные источники с разными ID) или допустимы по бизнес-логике. UNION только там, где дедупликация действительно нужна.
ORDER BY и LIMIT с UNION
-- ORDER BY применяется ко всему результату, а не к части
(SELECT name, 'vip' AS tier FROM vip_users ORDER BY name LIMIT 5)
UNION ALL
(SELECT name, 'regular' AS tier FROM regular_users ORDER BY name LIMIT 5)
ORDER BY tier, name
LIMIT 10;
-- Скобки задают ORDER BY/LIMIT для каждой части отдельно
Подводные камни
- Разное число столбцов в частях UNION вызывает ошибку
1222: The used SELECT statements have a different number of columns. - Имена столбцов результата берутся из первого запроса — в остальных частях они игнорируются; это сбивает с толку при алиасах.
ORDER BYбез скобок в частях UNION применяется ко всему объединённому результату, а не к части — порядок внутри частей не гарантируется.- Типы данных должны быть совместимы. MySQL приводит типы автоматически, но это может дать неожиданные результаты (например,
INT UNION VARCHAR→ всё стало строками). NULL-значения при дедупликации вUNION: дваNULLсчитаются одинаковыми и коллапсируются — поведение отличается от стандартного сравненияNULL = NULL.- Большое число частей UNION ALL создаёт большую временную таблицу; лучше использовать агрегацию или партиционирование.
Common mistakes
- Не уточнять storage engine и говорить о union и union all так, будто MyISAM и InnoDB ведут себя одинаково.
- Игнорировать implicit commit, autocommit, isolation level или binlog там, где они меняют ответ.
- Описывать PostgreSQL-поведение как MySQL-поведение.
- Забывать проверить план через EXPLAIN и фактическую версию MySQL.
What the interviewer is testing
- Кандидат объясняет union и union all через реальный механизм MySQL, а не общими словами.
- Приводит корректный SQL или диагностический запрос для этой СУБД.
- Называет ограничения, версионные отличия или эксплуатационные последствия.
- Связывает ответ с проектированием приложения, производительностью, надежностью или безопасностью.