作者介绍
万守兵:腾讯云行业架构师,对云上双活架构、迁移方案有比较深的了解,现主要负责腾讯云泛互行业TOP级客户的解决方案架构工作。
高可用挑战
1. 高可用挑战:时间要求
2. 高可用挑战:各种不稳定的原因
常见事故及问题归类如下:
互联网通用架构和分层
典型互联网架构分层设计如下:
系统正交分解如下:
分类 | 服务治理 目标 | 技术 架构 | 监控层 |
---|---|---|---|
外层 | 客户端SLA、攻防/扫描/审计 CDN合理/稳定、DNS合理/稳定流量峰值 | CDN DNSPOD/Ip直连高防 | 客户端监控、CDN监控、DNSPOD监控安全 |
接入层 | 异地多活、服务SLA、负载均衡、流量调度、机房切换、限流/降级 | F5自动化GW nginx(etcd+confd) | 机房整体监控服务监控 (响应延时链接) |
服务层 | 分布式架构、定时调度管理、灰度发布、自动化灾备恢复、机房双活、大数据处理、一体化数据研发 | 应用架构 | 服务状态(服务响应) 性能监控(DB监控) 后端资源监控 语义监控 调用链分析 |
数据层 | 服务监控和性能调节、高并发 水平扩容、快速自动灾备恢复、定期归档备份 | 分布式数据库、分布式事务消息组件 | 服务&业务级监控 |
资源层硬件层 | 灾备恢复、资源回收、日志归档备份、部署初始化 | SDN无人值守自动安装、硬件生命周期平台 | 硬件监控、网络监控 |
构建外层高可用
1. 外层DNS高可用方案
2. 外层CDN高可用性
3. 外层高防高可用
构建接入层高可用
1. 接入层构建多可用多活
2. 接入层LB高可用
腾讯云CLB底层是基于TGW,本身具有高可用,具体如下:
1)多级容灾
跨园区容灾 ->交换机容灾
机架容灾-> TGW集群容灾
2)防攻击
流量攻击:过载保护
DDOS攻击:syn代理和LRU淘汰
3)安全性
黑名单、域名封禁
构建服务端高可用
3. 服务层框架高可用
2. 服务层高可用思路
数据层高可用
1. CBD高可用
故障一:数据库节点异常
故障二:可用区异常
故障三:异常操作导致数据库受损
2. DB Proxy高可用
通过DB Proxy实现:
3. 对象存储高可用
腾讯云对象存储COS提供异地备份功能,可以实现数据的异地备份和恢复。
移动端高可用
高可用演练验收
没看过瘾?这里还有
点击阅读原文,领取 COS 限时1元礼包!