MySQLSeniorSystem design
Как работает репликация MySQL (primary/replica)?
MySQL репликация работает через binary log: primary записывает изменения в binlog, replica читает их через I/O thread, сохраняет в relay log, SQL thread применяет к данным. Поддерживаются асинхронный, semi-sync и групповой режимы.
Архитектура репликации
MySQL репликация построена на binary log (binlog) — журнале всех изменений данных. Основные компоненты:
- Primary (master): записывает изменения в binlog.
- Replica I/O thread: подключается к primary, читает binlog и записывает в локальный relay log.
- Replica SQL thread: читает relay log и применяет события к данным реплики.
Настройка репликации
-- my.cnf на primary:
-- [mysqld]
-- server-id = 1
-- log_bin = /var/lib/mysql/binlog
-- binlog_format = ROW
-- gtid_mode = ON
-- enforce_gtid_consistency = ON
-- my.cnf на replica:
-- [mysqld]
-- server-id = 2
-- log_bin = /var/lib/mysql/replica-binlog
-- relay_log = /var/lib/mysql/relay-log
-- gtid_mode = ON
-- enforce_gtid_consistency = ON
-- read_only = ON
-- Создать пользователя репликации на primary:
CREATE USER 'repl'@'%' IDENTIFIED BY 'repl_password';
GRANT REPLICATION SLAVE ON *.* TO 'repl'@'%';
-- На replica настроить подключение к primary (GTID-режим):
CHANGE REPLICATION SOURCE TO
SOURCE_HOST='primary.db',
SOURCE_USER='repl',
SOURCE_PASSWORD='repl_password',
SOURCE_AUTO_POSITION=1; -- GTID auto-positioning
START REPLICA;
SHOW REPLICA STATUS\G
Мониторинг состояния репликации
SHOW REPLICA STATUS\G
-- Ключевые поля:
-- Replica_IO_Running: Yes — I/O thread работает
-- Replica_SQL_Running: Yes — SQL thread работает
-- Seconds_Behind_Source: 0 — лаг в секундах
-- Executed_Gtid_Set — применённые GTID на реплике
-- Retrieved_Gtid_Set — полученные от primary
-- Last_SQL_Error — ошибка применения (например, дедлок)
-- Мониторинг через performance_schema:
SELECT * FROM performance_schema.replication_connection_status\G
SELECT * FROM performance_schema.replication_applier_status_by_worker\G
Параллельная репликация
По умолчанию SQL thread однопоточный. Параллельная репликация ускоряет применение на реплике:
-- my.cnf на replica:
-- replica_parallel_workers = 8
-- replica_parallel_type = LOGICAL_CLOCK -- MySQL 8 default
-- replica_preserve_commit_order = ON -- сохраняет порядок транзакций
-- Проверить workers:
SELECT * FROM performance_schema.replication_applier_status_by_worker;
Semi-synchronous репликация
Гарантирует, что хотя бы одна реплика получила событие до подтверждения commit на primary:
-- На primary:
INSTALL PLUGIN rpl_semi_sync_source SONAME 'semisync_source.so';
SET GLOBAL rpl_semi_sync_source_enabled = 1;
SET GLOBAL rpl_semi_sync_source_timeout = 1000; -- fallback через 1 сек
-- На replica:
INSTALL PLUGIN rpl_semi_sync_replica SONAME 'semisync_replica.so';
SET GLOBAL rpl_semi_sync_replica_enabled = 1;
-- Мониторинг:
SHOW STATUS LIKE 'Rpl_semi_sync%';
Group Replication (InnoDB Cluster)
Встроенный multi-primary или single-primary кластер с автоматическим failover:
-- Установка и запуск через MySQL Shell:
dba.createCluster('myCluster');
dba.getCluster().addInstance('root@replica2:3306');
dba.getCluster().status();
Подводные камни
- Асинхронная репликация допускает потерю данных при failover — primary подтверждает commit до того, как реплика получила событие.
- GTID-режим несовместим с
CREATE TABLE ... SELECTв MySQL 5.7 (ошибка); в MySQL 8 это ограничение снято. - При ошибке SQL thread репликация останавливается — нужен мониторинг
Replica_SQL_Running=Noи алерты. - Replica в режиме
read_only=ONне блокирует пользователей с привилегией SUPER — используйтеsuper_read_only=ON. - Параллельная репликация с
LOGICAL_CLOCKтребует, что транзакции на primary коммитились с перекрытием — при низком concurrency на primary параллелизм не даст ускорения. - Binlog rotation: если реплика отстала и нужный binlog файл удалён с primary — репликацию придётся пересоздавать с нуля.
- CHANGE REPLICATION SOURCE TO без
RESET REPLICAнакапливает старые relay log — при рестарте применяются старые события.
Common mistakes
- Не уточнять storage engine и говорить о primary/replica replication так, будто MyISAM и InnoDB ведут себя одинаково.
- Игнорировать implicit commit, autocommit, isolation level или binlog там, где они меняют ответ.
- Описывать PostgreSQL-поведение как MySQL-поведение.
- Забывать проверить план через EXPLAIN и фактическую версию MySQL.
What the interviewer is testing
- Кандидат объясняет primary/replica replication через реальный механизм MySQL, а не общими словами.
- Приводит корректный SQL или диагностический запрос для этой СУБД.
- Называет ограничения, версионные отличия или эксплуатационные последствия.
- Связывает ответ с проектированием приложения, производительностью, надежностью или безопасностью.