MySQLJuniorTechnical

В чём разница между UNION и UNION ALL?

UNION объединяет результаты двух запросов и удаляет дубликаты (сортировка + дедупликация). UNION ALL включает все строки включая дубликаты и работает быстрее, так как не выполняет сортировку.

UNION и UNION ALL в MySQL

Оба оператора объединяют результирующие наборы двух и более SELECT-запросов в один. Требования: одинаковое количество столбцов в каждом запросе и совместимые типы данных в соответствующих позициях.

UNION — с дедупликацией

MySQL сортирует объединённый результат и удаляет строки-дубликаты. Это дороже по ресурсам.

-- Все уникальные email-адреса из двух таблиц
SELECT email FROM customers
UNION
SELECT email FROM partners;
-- Дублирующиеся email встречаются только один раз

UNION ALL — без дедупликации

Все строки из обоих запросов включаются в результат как есть. Нет сортировки, нет проверки дублей — значительно быстрее.

-- Все транзакции из двух источников (дубли допустимы)
SELECT id, amount, created_at, 'income'  AS type FROM income_tx
UNION ALL
SELECT id, amount, created_at, 'expense' AS type FROM expense_tx
ORDER BY created_at DESC
LIMIT 50;

Практический пример: единый лог событий

SELECT
    'order'    AS entity_type,
    id         AS entity_id,
    created_at AS event_time,
    status     AS detail
FROM orders
WHERE user_id = 42

UNION ALL

SELECT
    'payment'  AS entity_type,
    id         AS entity_id,
    created_at AS event_time,
    CAST(amount AS CHAR) AS detail
FROM payments
WHERE user_id = 42

ORDER BY event_time DESC;

Сравнение производительности

  • UNION: материализует временную таблицу, сортирует её, удаляет дубли — O(N log N) по памяти и CPU.
  • UNION ALL: потоковая передача строк без дополнительных операций — O(N).

Используйте UNION ALL всегда, когда дубликаты логически невозможны (разные источники с разными ID) или допустимы по бизнес-логике. UNION только там, где дедупликация действительно нужна.

ORDER BY и LIMIT с UNION

-- ORDER BY применяется ко всему результату, а не к части
(SELECT name, 'vip' AS tier FROM vip_users ORDER BY name LIMIT 5)
UNION ALL
(SELECT name, 'regular' AS tier FROM regular_users ORDER BY name LIMIT 5)
ORDER BY tier, name
LIMIT 10;
-- Скобки задают ORDER BY/LIMIT для каждой части отдельно

Подводные камни

  • Разное число столбцов в частях UNION вызывает ошибку 1222: The used SELECT statements have a different number of columns.
  • Имена столбцов результата берутся из первого запроса — в остальных частях они игнорируются; это сбивает с толку при алиасах.
  • ORDER BY без скобок в частях UNION применяется ко всему объединённому результату, а не к части — порядок внутри частей не гарантируется.
  • Типы данных должны быть совместимы. MySQL приводит типы автоматически, но это может дать неожиданные результаты (например, INT UNION VARCHAR → всё стало строками).
  • NULL-значения при дедупликации в UNION: два NULL считаются одинаковыми и коллапсируются — поведение отличается от стандартного сравнения NULL = NULL.
  • Большое число частей UNION ALL создаёт большую временную таблицу; лучше использовать агрегацию или партиционирование.

Common mistakes

  • Не уточнять storage engine и говорить о union и union all так, будто MyISAM и InnoDB ведут себя одинаково.
  • Игнорировать implicit commit, autocommit, isolation level или binlog там, где они меняют ответ.
  • Описывать PostgreSQL-поведение как MySQL-поведение.
  • Забывать проверить план через EXPLAIN и фактическую версию MySQL.

What the interviewer is testing

  • Кандидат объясняет union и union all через реальный механизм MySQL, а не общими словами.
  • Приводит корректный SQL или диагностический запрос для этой СУБД.
  • Называет ограничения, версионные отличия или эксплуатационные последствия.
  • Связывает ответ с проектированием приложения, производительностью, надежностью или безопасностью.

Sources

Related topics