前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >High Availability 01 - 高可用概念

High Availability 01 - 高可用概念

作者头像
Reck Zhang
发布2021-08-11 12:05:57
5230
发布2021-08-11 12:05:57
举报
文章被收录于专栏:Reck Zhang

High Availability

高可用(High Availability)基本上来说, 就是要让我们的计算环境做到full-time的可用性, 在设计上一般需要:

  1. 对软硬件的冗余, 以消除单点故障. 任何系统都会有一个或者多个冗余系统做standby.
  2. 对故障的检测和恢复. 检测故障以及用备份的节点接管故障点, 也就是failover.
  3. 需要很可靠的交汇点(CrossOver), 这些是不容易冗余的节点, 比如域名解析, 负载均衡器等.

冗余节点的问题

冗余节点最大的难题就是对于有状态的节点的数据复制和数据一致性的保证(无状态节点的冗余相对比较简单):

  1. 如果系统的数据镜像到冗余节点是异步的, 那么在failover的时候就会出现数据差异的情况.
  2. 如果系统的数据镜像到冗余节点是同步的, 那么就会导致冗余节点越多性能越慢.

高可用设计原理

  1. 要做到数据不丢失, 就必需要持久化.
  2. 要做到服务高可用, 就必需要有备用, 无论是应用节点还是数据节点.
  3. 要做到复制, 就会有数据一致性的问题.
  4. 我们不可能做到100%的高可用, 能做到几个9的SLA.
ha-infrastructure
ha-infrastructure

测量SLA

  1. 故障发生到恢复的时间.
  2. 两次故障间的时间.

大多数都是采用第一种方法, 也就是服务不可用的时间.

影响因素

  1. 无计划宕机
unplanned_downtime
unplanned_downtime
  1. 系统级故障 - 包括主机, 操作系统, 中间件, 数据库, 网络, 电源以及外围设备等.
  2. 数据和中介的故障- 包括人员误操作, 硬盘故障等.
  3. 自然灾害, 人为破坏, 供电问题等.
  1. 有计划宕机
planned_downtime
planned_downtime
  1. 日常任务: 备份, 容量规划, 用户和安全管理, 后台批处理应用等.
  2. 运维相关: 数据库维护, 应用维护, 中间件维护, 操作系统维护, 网络维护等.
  3. 升级相关: 数据库, 应用, 中间件, 操作系统, 网络, 包括网络升级等.
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-12-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • High Availability
    • 冗余节点的问题
      • 高可用设计原理
        • 测量SLA
          • 影响因素
          相关产品与服务
          数据库
          云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档