API 文档

故障切换

最近更新时间:2021-11-23 11:17:18

自动故障切换

云数据库 Redis 提供自动故障切换能力,保障服务的可用性,自动故障切换包括 Proxy 节点的故障切换和 Redis Server(Redis 数据存储节点)的故障切换。

Proxy 故障切换

云数据库 Redis 标准架构和集群架构都有 Proxy 节点,标准架构的 Proxy 节点数量为3个,集群架构的 Proxy 数量随着分片数量线性增长,Proxy 节点的高可用设计如下:

  • 多个 Proxy 节点保证 Proxy 服务的高可用和负载均衡。
  • Proxy 节点会部署到3个物理设备,以保障高可用。
  • Proxy 节点故障后,拨测系统会检测到节点不可用,并自动补充新的节点。

Redis Server 故障切换

Redis 标准架构和集群架构采用的是 Redis Cluster 原生的集群管理机制,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,节点故障判断的时效性取决于 cluster-node-timeout,默认值是15000ms,建议不要更改该参数。
节点故障的判断请参考 Redis Cluster 原生设计

故障模拟

为了配合业务做故障模拟测试,云数据库 Redis 提供故障模拟功能,您可以在控制台使用故障模拟功能。
模拟故障原理:通过向所有的 Redis 主节点发送 shutdown 命令,触发系统自动的 HA(High Availability)逻辑来实现故障模拟,仅状态为“运行中”的实例才能进行故障模拟操作。

  1. 登录 Redis 控制台,在实例列表,单击实例 ID,进入实例管理页面。
  2. 在实例管理页面,选择节点管理页,选择更多操作 > 模拟故障配置变更 > 模拟故障
    集群架构实例故障模拟入口:

    标准架构实例故障模拟入口:
  3. 在弹出的对话框,输入实例密码,单击确定
    注意:

    • 模拟故障将导致 Redis 服务在一定时间范围内不可用,通常故障恢复的时间小于1分钟,如果您正在写入数据,可能会产生数据丢失,请谨慎操作。
    • 故障模拟导致的服务不可用,将不计入 Redis 承诺的服务 SLA 范围内。
目录