前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >技术分享 | MySQL:从库复制半个事务会怎么样?

技术分享 | MySQL:从库复制半个事务会怎么样?

原创
作者头像
爱可生开源社区
发布2022-06-30 13:29:55
8840
发布2022-06-30 13:29:55
举报
文章被收录于专栏:爱可生开源社区

作者:胡呈清爱可生 DBA 团队成员,擅长故障分析、性能优化,个人博客:https://www.jianshu.com/u/a95ec11f67a8,欢迎讨论。本文来源:原创投稿*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


复制异常

在复制过程中,主库发生故障或者网络中断,都会造成 slave io thread 中断,就有可能出现从库只复制了半个事务的情况。比如主库执行的事务如下:

代码语言:txt
复制
begin;
insert 1;
insert 2;
commit;

从库接收的 binlog 可能只包含事务的一部分,比如:

  • 情况1:只包含 begin;
  • 情况2:只包含 begin;insert 1;
  • 情况3:只包含 begin;insert 1;insert 2;

从库的 slave sql thread 回放完这部分 binlog 后,会等待 slave io thread 从主库读取剩余的 binlog,而在此之前 sql 线程回放这半个事务,就和我们手工执行半个事务一样,不会提交也不会回滚。

我们应该如何应对这种异常呢?

  • 当 slave io thread 恢复,应该做什么?
  • 当 slave io thread 无法恢复,应该做什么?

实验过程

测试方法:

代码语言:txt
复制
##1. 在从库上用 tc 模拟网络延迟,意在使读取 binlog 的速度变慢
tc qdisc add dev eth0 root netem delay 3000ms 3000ms 100%

##2. 在主库执行一个多语句事务
begin;
update t2 set pad='4' where id < 40;
update t2 set pad='5' where id < 50;
update t2 set pad='6' where id < 60;
commit;

##3. 在主库执行 commit 成功后,立刻用 iptables 切断主从之间的网络
iptables -A OUTPUT -d 172.16.21.4 -j DROP
iptables -A INPUT -s 172.16.21.4 -j DROP

这样我们可以在从库上观察到的现象为:

  • 其中一个 worker 线程状态是Waiting for an event from Coordinator,这个状态说明 work 线程已经干完活在等 Coordinator (协调线程)分配新的 relay log event ,但同时又显示它正在执行update t2 set pad='5' where id < 50,这是矛盾1:
  • show slave status输出中,Retrieved_Gtid_SetExecuted_Gtid_Set相等(意味着sql线程已经回放完所有的relay log),但是上图 worker 线程又正在回放SQL ,这是矛盾2:

最后我们通过 relay log 实锤,可以看到这个事务的 relay log 并不完整,到update t2 set pad='5' where id < 50; 这个Rows_query event就结束了:

当 slave io thread 无法恢复

如果 slave io thread 长时间不能恢复,那么 sql 线程会因为等不到剩余的 binlog,一直无法提交或回滚,会一直持有这个事务的锁:

如果是主库故障导致的 slave io thread 异常,那很可能会进行主从切换,这个从库提升为主后,SQL线程持有的事务锁可能会阻塞业务请求。

此时应该 stop slave 停止 sql 线程,让事务回滚释放锁。需要注意的是:此情况下 stop slave 会等待 60 秒(等 slave io thread 接收事务剩余的binlog),60秒超时后才会停止 sql 线程:

当 slave io thread 恢复

slave io thread 异常中断后,sql 线程是正常工作的,sql 线程执行了部分事务,并且会等待 io 线程发送新的 binlog。slave io thread 线程恢复后,如果是基于 GTID 的复制,会从当前 GTID 事务开始重新获取完整的 binlog,从库会先回滚当前事务,然后再重新回放新收到的 binlog。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 复制异常
  • 实验过程
  • 当 slave io thread 无法恢复
  • 当 slave io thread 恢复
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档