前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >记一次MySQL数据库主从恢复过程

记一次MySQL数据库主从恢复过程

作者头像
Lvshen
发布2022-05-07 08:26:35
7160
发布2022-05-07 08:26:35
举报
背景

相信大家的项目都是使用主从模式的数据库吧,我们在开发中可能要维护主从的情况比较少,只需要写增删改查就够了。但是最近自己经历一次主从异常的恢复。也算是有一份不一样的收获吧。

由于项目使用MySQL主从备份模式,在某一天因为数据异常导致数据库主从断开,钉钉也开始报警;

从钉钉告警可以知道,从库的SQL线程断了,原因在于从库没有该条数据,但是现在需要从库更新这条数据,导致的报错。

恢复过程

想要恢复主从,但是没有专业的DBA来恢复。怎么办?只有开发上场了恢复了。

跳过异常点

最初我的思路是:

“跳过异常的数据点 ”

说干就干

这里我先在从库中操作:

代码语言:javascript
复制
STOP SLAVE;

然后我们跳过有异常的这条记录:

代码语言:javascript
复制
SET @@SESSION.GTID_NEXT = '2c81fd96-5d38-11e9-99fa-005056af5ff7:109627190';

重新启动从库线程:

代码语言:javascript
复制
START SLAVE;

查看从库还有没有异常信息:

代码语言:javascript
复制
select LAST_ERROR_MESSAGE from performance_schema.replication_applier_status_by_worker 
order by LAST_ERROR_TIMESTAMP desc limit 1;

发现又出现新的错误:

代码语言:javascript
复制
Worker 1 failed executing transaction '2c81fd96-5d38-11e9-99fa-005056af5ff7:108617672' at master log mysql-bin.001581, end_log_pos 930051924; Could not execute Update_rows event on table rmp.rmp_equip_info; Can't find record in 'rmp_equip_info', Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; the event's master log mysql-bin.001581, end_log_pos 930051924

然后我们有跳过上面的错误点,发现还是会出现新的错误。最后干脆批量跳过。

代码语言:javascript
复制
SET @@GLOBAL.GTID_PURGED = '2c81fd96-5d38-11e9-99fa-005056af5ff7:90355471-109617802';

这里我将90355471-109617802的记录点都跳过。查看从库状态,发现IO线程和SQL线程都好了。终于可以放松一会了。

完整的恢复

结果第二天发现,又报错了。看来不能用跳过的方法了。因此我准备重新来一次完整的同步。

主要过程为:

  • 备份主库数据;
  • 重置主库和从库服务;
  • 删除从库数据,并将主库备份的数据还原到从库库中;
  • 重新开启主从同步;
备份主库

在备份数据前我们需要给主数据库开启只读功能。

在主库中操作

代码语言:javascript
复制
FLUSH TABLES WITH READ LOCK;

然后备份数据:

代码语言:javascript
复制
mysqldump -hlocalhost -uroot -P3306 -pxxxxx  rxx > ./rxx.sql

这里我们指定database,如rxx

等待了30分钟左右,数据备份完毕,看一下sql文件,大概36GB左右。

然后将备份的sql文件拷贝到从库中:

代码语言:javascript
复制
scp ./rmp.sql sysadmin@10.xx.xx.xxx:/home/sysadmin/lvshen

现在将master服务重置(主库中操作):

代码语言:javascript
复制
RESET MASTER;

解锁主库:

代码语言:javascript
复制
UNLOCK TABLES;

接下来需要在从库中操作了。

先删掉从库上面的数据库:

代码语言:javascript
复制
DROP DATABASE xxx;

然后创建一个新的库 xxx:

代码语言:javascript
复制
create database xxx;

将主库备份的数据还原到从库上:

代码语言:javascript
复制
SOURCE /home/sysadmin/lvshen/xxx.sql;

“tips:恢复时间比较长,大概40分钟左右,需要耐心等待 ”

最后我们重置slave服务,并且开启slave服务。

查看下从库状态,发现IO线程和SQL线程都已经正常了。

代码语言:javascript
复制
show slave status;

到这里主从终于恢复了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Lvshen的技术小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 恢复过程
    • 跳过异常点
      • 完整的恢复
        • 备份主库
    相关产品与服务
    数据库
    云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档