Redis 主从切换模拟

最近更新时间:2024-06-11 10:41:31

我的收藏

背景

Redis 集群是业务存储热数据的重要组件,为保证业务的可用性,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,默认的心跳超时时间 (cluster-node-timeout) 为15s。如果此故障节点为主节点时,腾讯云Redis将采取故障切换机制,将重新从备节点选举新的主节点。
腾讯云混沌演练平台基于以上特性,提供手动方式跨过节点故障阶段直接模拟HA策略的故障动作,您可通过该手动故障方式模拟当 Redis 集群发生故障切换机制的短时间内对业务的影响。

演练实施

演练准备

准备一台多节点跨 AZ 属性的 Redis 实例。

演练步骤

步骤1:创建演练

登录 混沌演练控制台,进入演练管理页面,单击新建演练,填写基本信息




步骤2:添加动作

根据模拟的容灾场景灵活选择主备切换模式:
优先同可用区切换
模拟主节点发生故障时,腾讯云Redis真实HA策略场景:数据最新节点优先提主;数据相同时优先同可用区其他节点选举。
优先跨可用区切换
模拟可用区整体故障时,其他可用区节点提主场景。




步骤3:执行演练动作

1. 执行演练



2. MFA 校验



3. 执行演练动作




结果观测

故障前节点状态信息
以优先跨可用区模式为例,观察注入故障前后可用区是否变更。



故障后节点状态信息