ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
[TOC] ## 一、主从同步的实现原理 ![](https://img.kancloud.cn/85/8e/858ec8c3aa7e0d4edb52649d98cfd70a_684x340.png) 首先,备库B跟主库A之间维持了一个长连接。 一个事务日志同步的过程: 1. 在备库B通过change master命令,设置主库A的IP、端口、用户名、密码,以及要从哪个位置开始请求binlog,这个位置包含文件名和日志偏移量 2. 在备库B上执行start slave命令,这时备库会启动io_thread、sql_thread。io_thread负责与主库建立连接 3. 主库A校验完用户名、密码后,开始按照备库B传过来的位置,从本地读取binlog,发给B 4. 备库B拿到binlog后,写到本地文件,称为中转日志(relay log) 5. sql_thread读取中转日志,解析出日志里的命令,并执行。 ## 一、binlog格式 说起主从同步,binlog是其中的重要依据。mysql binlog有三种格式:row、statement、mixed。 > binlog 的不同模式有什么区别呢? #### Statement:每一条会修改数据的sql都会记录在binlog中。 **优点**:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该根据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。) **缺点**:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last\_insert\_id(),以及user-defined functions(udf)会出现问题). #### Row:不记录sql语句上下文相关信息,仅保存哪条记录被修改。 **优点**: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题 **缺点**:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。 #### Mixedlevel: 是以上两种level的混合使用 一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog。 MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。 ## 二、主从结构(Master-Slave) Mysql集群里面有两种结构:主从结构、双主结构。 ### 如何避免主备切换中导致的双写问题? 主备切换过程中,备库应设置为**只读状态**。 ### 把备库设置成只读了,还能和主库保持同步更新吗? > 用于同步更新的线程,拥有超级权限。 readonly设置对超级(super)权限用户无效。 ## 三、双主结构(Master-Master) binlog确保了在备库执行相同的binlog,可以得到与主库相同的状态。 因此,可以认为正常情况下主备数据是一致的。即文章一开始的图中。M-S结构A、B两个节点的内容是一致的,实际生产上使用比较多的是双M结构——节点A和B之间总是互为主备关系。 ### 循环复制 MySQL在binlog中记录了这个命令第一次执行时所在实例的server id。因此,可以用下面的逻辑解决两个节点间的循环复制的问题: 规定两个库的server id必须不同,如果相同,则它们之间不能设定为主备关系 一个备库接到binlog并在重放的过程中,生成与原binlog的server id相同的新的binlog 每个库在收到从自己的主库发过来的日志后,先判断server id,如果跟自己的相同,表示这个日志是自己生成的,就直接丢弃这个日志。 参考文章: - [【阿里最新数据库面试题】MySQL主从一致性](https://blog.csdn.net/qq_33589510/article/details/117607508) - [Mysql Binlog三种格式详细介绍](https://www.cnblogs.com/baizhanshi/p/10512399.html)