有奖捉虫:行业应用 & 管理与支持文档专题 HOT

背景

在数据库系统中,主备切换是保障数据库高可用性的重要手段之一。主备切换可以确保在主节点故障时,备用节点能够快速接管主节点的工作,以保证系统的连续性和稳定性。腾讯混沌演练平台提供模拟云数据库 TDSQL-MySQL主备切换的场景故障动作,您可以使用该故障动作,来验证您的业务 TDSQL-MySQL 整体高可用能力。
进行主备切换演练,旨在帮助开发人员在更加复杂和真实的环境中进行系统测试和实验,以发现可能存在的问题和风险。通过混沌工程的实验和测试,开发人员可以更加全面地了解系统的工作方式和性能特征,并针对不同的故障场景制定相应的应对措施和策略,从而提高系统的稳定性和可用性。
说明:
主备切换会将实例的主节点切换到其他的备节点,可用于模拟可用区故障或节点故障时的切换过程,切换期间有可能会连接断连。
该故障有两种注入方式:
1. 优先同可用区注入:将会优先选择同可用区下的备节点作为切换目标节点,若没有满足条件的节点,便会寻找其他可用区下可切换的备节点。
2. 优先跨可用区注入:将会优先选择跨可用区下的备节点作为切换目标节点,若没有满足条件的节点,便会寻找相同可用区下可切换的备节点。

演练实施

步骤一:演练准备

一台云数据库 TDSQL-MySQL 实例,该实例为一主二备部署模式。(主:广三,备:广三/广四)




步骤二:演练编排

1. 登录 混沌演练控制台,进入演练管理页面,单击新建演练。



单击左下角跳过,新建空白演练。



2. 填写演练信息,选择对象类型 TDSQL-MySQL。



3. 添加实例并单击立即添加,即可添加故障动作。



4. 选择主备切换故障,配置故障动作参数。



配置故障参数,针对演示实例,这里配置切换模式为优先跨可用区切换。



5. 动作参数配置完成后,单击下一步。确定所有配置之后,随后单击提交,完成演练创建。




步骤三:执行演练

故障执行过程中,会触发 TDSQL-MySQL 实例主备切换,可以通过 云数据库 TDSQL 控制台 观测到实例主备节点架构变化。
故障前:主-广三,备1-广三,备2-广四



进入演练详情,单击执行,开始执行演练。



执行故障动作。



故障注入过程中,可前往 云数据库 TDSQL控制台 观察节点变化。



故障执行成功之后,可在云数据库 TDSQL控制台 观察到主节点发生变化。主节点已经由原广州三区切换至跨可用区的广州四区的备节点上。



执行故障恢复动作,将实例部署状态恢复至故障前状态。



故障恢复,会再次触发一次主备切换,TDSQL控制台实例信息会有切换展示。



恢复成功之后,可在控制台观测到节点状态已经恢复至故障前状态。