背景
云顾问 - 混沌演练提供模拟云数据库 MySQL 主节点故障的场景故障动作,您可以使用该故障动作来验证您的业务 MySQL 灾备能力及整体高可用能力。
注意:
故障描述
该故障会向实例注入致命错误,来模拟多节点架构实例主节点故障。在故障动作执行期间会出现短暂数据库连接断开或者无法连接状况,进而造成数据库无法访问,请谨慎操作!故障注入后,MySQL 实例会进行主从切换,原从节点会成为新主节点,并会在原主可用区拉起新节点作为新备节点。
演练实施
步骤一:演练准备
一台 云数据库 MySQL 实例,双节点架构。
一台 CVM 实例,用于测试连接 MySQL 实例。
步骤二:演练编排
1. 登录 云顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练。
2. 单击跳过,新建空白演练。
![](https://qcloudimg.tencent-cloud.cn/image/document/0b4c80b8e197981677f4b2c11511f3cf.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/0b4c80b8e197981677f4b2c11511f3cf.png)
3. 填写演练信息,选择演练目标云数据库 MySQL 实例。
![](https://qcloudimg.tencent-cloud.cn/image/document/d079dee9dd9f407eda6946033d33892b.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/d079dee9dd9f407eda6946033d33892b.png)
4. 添加 MySQL 主节点故障演练动作。单击下一步。
![](https://qcloudimg.tencent-cloud.cn/image/document/48d1c93d587c4eec84b2ccce6331fd54.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/48d1c93d587c4eec84b2ccce6331fd54.png)
5. 为故障动作配置动作参数信息,并单击确定。
![](https://qcloudimg.tencent-cloud.cn/image/document/16171ed9dd39e97202819f01f224a5a2.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/16171ed9dd39e97202819f01f224a5a2.png)
6. 动作参数配置完成后,单击下一步。确定所有配置之后,单击提交,完成演练创建。
![](https://qcloudimg.tencent-cloud.cn/image/document/429c98ce60f7e03bcff2f7b8396c9889.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/429c98ce60f7e03bcff2f7b8396c9889.png)
步骤三:执行演练
故障前:![](https://qcloudimg.tencent-cloud.cn/image/document/4bd27b2b6a3532f692a125307e94c058.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/4bd27b2b6a3532f692a125307e94c058.png)
观察 MySQL 实例主备节点所在可用区。使用 CVM 实例登录当前 MySQL 实例,建立一个客户端连接。
![](https://qcloudimg.tencent-cloud.cn/image/document/e572a5c7d06a4c671f1250ce6124a04f.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/e572a5c7d06a4c671f1250ce6124a04f.png)
执行演练:
![](https://qcloudimg.tencent-cloud.cn/image/document/a6abaa131d0a58622d4b48ee05fa8fd6.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/a6abaa131d0a58622d4b48ee05fa8fd6.png)
故障执行成功之后,可在 云数据库 MySQL 控制台 看到故障效果,即故障后原备节点被提为主节点,并在原主节点所在可用区重新拉起了一个新节点作为备节点;并且右上角可收到异常告警(数据来自 数据库智能管家 DBbrain 巡检)。
![](https://qcloudimg.tencent-cloud.cn/image/document/08d294e1f5ee88d8aa434697873770e1.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/08d294e1f5ee88d8aa434697873770e1.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/3ac779079193101add9e8eb264f7e965.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/3ac779079193101add9e8eb264f7e965.png)
故障后实例监控
MySQL 主节点故障后,可以通过实例监控面板观测到主节点故障时,当前实例出现短暂不可用的情况。
![](https://qcloudimg.tencent-cloud.cn/image/document/07b2cc9900588712afbcefbc34ebdc63.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/07b2cc9900588712afbcefbc34ebdc63.png)
在此期间使用 CVM 执行 sql,原连接已经断开,需要重连。
![](https://qcloudimg.tencent-cloud.cn/image/document/ec0e2e0ae52bba726cfe29b290095308.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/ec0e2e0ae52bba726cfe29b290095308.png)
同时 DBbrain 会话监控原连接已经不存在,新连接出现。
![](https://qcloudimg.tencent-cloud.cn/image/document/941edb92522420162eafab76f639c805.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/941edb92522420162eafab76f639c805.png)