基于MySQL5.6实现的同城多IDC间的MySQL部分库表数据复制方案

近期刚刚实施了一套同城多IDC间的mysql主从同步方案，主要功能是实现的一主多从数据复制，但真正实施起来确又并不是如此简单。
最主要的制约因素无外乎就是通信带宽和数据量负载大小。
方案实施的背景：

4个集群的IDC机房间通过20Mb专线相互连通；
选取IDC A的mysql数据库作为master；
该master角色的mysql数据库，会有一部分表的数据量异常大，单表过亿；
该master数据库的binlog日志量平均每天60GB；
数据同步使用需求是，只需对数据库中的部分库表做同步即可，这部分小表的数据量分别在个位数到百万之间；
业务使用需求是，主从之间数据同步，同步延时只要控制在2分钟以内，就可以满足上层的业务使用需求。

基于以上情况的分析：
专线带宽有限，不可能复制全部库表数据，也不可能达到实时复制；
IDC间有库表复制需求的表只是一部分，这些表的存量数据在几条到一百万条之间；
复制策略设计为mysql master-->middle slave-->slave，master和middle slave位于同一IDC机房私网内；
第一阶段mysql主从，用于实现从全部库表中过滤出需要使用的部分表；
第二阶段mysql middle alve -->slave，用于实现指定的表在集群间的数据复制；

一、IDC内部mysql部分表主-从复制
IDC A mysql ha 双机部署在server1和server2上面，使用共享存储，双机软件为heartbeat。主、备机的硬件配置相同。对外服务使用的vip。在该方案中，正常情况下mysql服务运行在主机上，而备机server2一直处在热备待机状态，资源大部分时间内是没有被利用到的。

这次我们把mysql从部署在数据库备机server2上面。因为在mysql ha进行主备切换时，要使用备机上的mysql用户、3306端口以及其它资源文件，所以在新增一个mysql实例作为slave时，需要完全得避开与这些资源的使用冲突。

1、mysql从的数据复制策略说明：
为减少对应用程序层面的干扰，暂不考虑在mysql主机上进行分库处理，因此也就无法使用binlog-do-db功能来控制仅复制指定的数据库（比如把待复制的表放入一个新的库中，然后基于这个库进行mysql主从间的数据复制）。
注：使用binlog-do-db参数并不安全，因为它会仅让指定的库打印binlog日志。这在发生意外故障，就无法满足进行全部库的日志回滚的要求了。

我们选择使用在mysql从上通过Replicate-do-table功能，来控制哪些表的数据会被写入到mysql slave的数据库中，而这一操作的背景条件是在mysql主、从之间是进行的全部的数据库表复制（仅在从机上决定写入数据库时再按表做判断和过滤操作）。
这个数据复制操作，是在IDC A局域网内主、备机网卡2通过网线直接，使用mysql主从复制功能中的mysql IO thread进行。主机的网卡1是用于业务生产使用。

每天的binlog日志数据量大约有60GB，这些全部要复制到从机。从机只有先把binlog复制过来后，才能根据表过滤规则判断是否需要入库。从机会把复制来的binlog存放在relaylog中，从中仅过滤出与过滤条件相符的库表事件，然后执行并记录到自己的binlog中。
通过以上设计，在IDC A的mysql slave上只保留了我们需要在IDC间进行数据复制的那些小表，slave本身基于这些小表而产生的binlog日志量成功降低到每天100MB。通过 IDC间的专线，甚至是直接使用互联网带宽实施IDC间的这部分数据表的数据复制同步，可行性都是很高的。

mysql间的主从复制本来就是异步的，任何形式的实时热备的要求，都是在耍流氓。不同的技术满足不同的场景，绝大数企业是承受不了同城热备的成本的。

2、mysql从的部署信息说明：
安装目录：/data/mysql-middle-slave/mysql
数据目录：/data/mysql-middle-slave/mysql_datadir
sock文件：/data/mysql-middle-slave/mysql.sock
pid文件： /data/mysql-middle-slave/mysql_datadir/server2_HA.pid
配置文件：/data/mysql-middle-slave/mysql_conf/my.cnf
监听端口：9000
错误日志：/var/log/mysqld-slave.log
启动脚本：/etc/init.d/mysqld-slave 可以使用service mysqld-slave start/stop/restart管理
在server2本机登录middle-slave的mysql方法：mysql --port=9000--socket=/data/mysql-middle-slave/mysql.sock -uroot -p

3、mysql主从复制使用的网段
在IDC A的mysql主、备HA双机之间是通过主机的网卡2传输的双机心跳监测数据。网卡1是对外提供mysql服务的网卡，目前平均流量在100Mbps。
为减少对生产环境的影响，我们使用网卡2作为mysql主从间数据复制使用的网卡。主机为10.0.0.1，备机为10.0.0.2 。

4、主从部分表数据复制方案实施步骤
（1）在主机上执行授权配置
设置mysql数据复制账户
mysql> GRANT REPLICATION SLAVE ON *.* TO repl@'10.0.0.2' IDENTIFIED BY 'repl';
mysql> flush privileges;
在mysql主机上对slave开放3306端口的授权
ACCEPT tcp -- 10.0.0.2 0.0.0.0/0 state NEW tcp dpt:3306

（2）从库配置my.cnf
server-id = 2
log-bin=/data/mysql-middle-slave/mysql_datadir/mysql-bin
binlog_format=mixed
binlog_cache_size = 4M
max_binlog_size = 1024M
expire-logs-days = 10
slow_query_log = 0
long_query_time = 10
log-error = /var/log/mysqld-slave.log
slave-skip-errors = all
log_slave_updates = 1
skip-slave-start

#mysql replication policy
replicate_wild_do_table=mydatabase.code
replicate_wild_do_table=mydatabase.info
replicate_wild_do_table=mydatabase.location
replicate_wild_do_table=mydatabase.controller
replicate_wild_do_table=mydatabase.user_level
replicate_wild_do_table=mydatabase.check_type
replicate_wild_do_table=mydatabase.code_price
replicate_wild_do_table=mydatabase.service_info
replicate_wild_do_table=mydatabase.user_param
replicate_wild_do_table=mydatabase.method_info
replicate_wild_do_table=mydatabase.thread_code

（3）从主库导出一份数据快照
使用mysqldump来得到一个数据快照可分为以下几步：
因为主库设置的是transaction_isolation = REPEATABLE-READ，所以支持以下方法导出一致性的数据。仅导出需要实现主从复制的表。
mysqldump -uroot -p --single_transaction --master-data=2 mydatabase code info location controller user_level check_type code_price service_info user_param method_info thread_code > master_partial.sql

（4）拷贝备份数据至从库并导入
先确认从库上已经按正确字符集要求创建了数据库，再执行数据导入。
CREATE DATABASE `mydatabase` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

mysql --port=9000 --socket=/data/mysql-middle-slave/mysql.sock -uroot -p mydatabase < master_partial.sql

（5）在备份文件master_partial.sql查看binlog和pos值

head -25 master_partial.sql
-- CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=122; #举例，大概22行

（6）从库设置从这个日志点同步并启动

mysql> change master to master_host='10.0.0.1',
-> master_user='repl',
-> master_password='repl',
-> master_port=3306,
-> master_log_file='mysql-bin.000001',
-> master_log_pos=122;

mysql> start slave;

mysql> show slave status\G;

观察mysql主从同步线程的状态。

如果因故需要暂停主从复制，可以从机上执行：mysql>stop slave;

mysql从上的数据复制功能在重启mysqld服务后，需要手工登录mysql，并执行start slave进行开启。

（7）临时中止与恢复主从数据复制
从mysql5.6版本开始，在mysql slave上执行了stop slave命令后，虽然中止了主从间的数据复制服务，但主从复制的配置信息仍然会被保存在缓存中。所以如果此时继续执行start slave命令，则会正常得继续前面中断的主从复制工作。
如果在执行了stop slave命令后，又重启了mysql slave的服务，那么就需要重新做一遍主、从间数据复制的配置了。先前的主从配置信息，在重启后不复存在。

（8）主从间数据库表状态不一致时的处理办法
可以有各种情况会造成mysql slave的库表数据状态与master不一致。
这时可以先停止主从复制：在从机上登录mysql并执行stop slave；
在mysql从上执行reset slave；
重新按前面的操作方法，从master上导出一份库表数据并传输到从机上，导入mysql从；
在mysql从上，根据上一步中得到的备份文件大约第25行注明的master binlog信息，重新设置change master to主从复制配置；
在mysql从上，执行start slave，重新开启主从复制；
使用show slave status\G查看主从复制状态；

注：在执行reset slave命令时，mysql slave会清除本地的一些日志文件（it clears the master info and relay log info repositories, deletes all the relay log files, and starts a new relay log file ）。

（9）怎么在现有的库表之外，按需增减主从间进行数据复制的表
停从机的mysql数据复制服务，stop slave，reset slave；
修改从机的my.cnf文件，更新要过滤的库表信息；
重启从机的mysqld服务；
重新配置主、从间的数据同步、主从复制；

二、IDC间的mysql数据复制
按照 mysql master-->middle slave-->slave的实施策略，其它3个IDC的mysql都去和IDC A的mysql slave进行数据复制同步。
需要明确的是其它3个IDC的mysql都并不是一个空的数据库，而是原本就和IDC A的库表结构、规模相同、相当的。我们在实施另外3个IDC mysql与IDC A的mysql slave进行数据复制时，仍然需要使用Replicate-do-table功能来设置过滤条件，仅允许指定的部分表可以同步数据。
与此同时，其它3个IDC的数据库中未参与到主从复制中的那些库表，仍然需要继续被自己集群内的业务应用进行读、写。

这里就不再重复主从配置方法了，请参照前面即可。该方案实施后，在现有网络条件下、现有数据量条件下，运行良好。

在对以上方案进行反复测试的过程中，我也发现mysql服务并不会去检查slave上表的数据是否真得与master上在各个方面都是完全一致的。你完全可以在不影响到主从复制间发生表主键冲突的条件下，向slave上的表中插入数��。
而且，在仅同步mysql主从间的一部分表的条件下，无论是master上还是slave上的那些没参与到主从数据复制任务中的库表，仍然可以像往常一样得读写，而不会相互影响或制约。

基于MySQL5.6实现的同城多IDC间的MySQL部分库表数据复制方案

相关推荐