有奖捉虫:行业应用 & 管理与支持文档专题 HOT

视频介绍



简介

此次实操环节,我们准备了一个跨可用区部署的网站服务,我们将尝试利用混沌工程验证服务跨可用区容灾的有效性。网站内容来自开源论坛社交网站bootcamp,网站提供了基础的新闻发布、博客发布、问题发布以及评论、点赞等基本功能,网站的架构示意图如下:





接入层

从接入层来看,我们将两台 CLB 部署在广州三区广州四区,并将两个 CLB VIP 接入到 DNSPod,DNSPod 配置有智能全局流量管理,在某个 CLB 故障时,能够在分钟级将域名解析到正常的 CLB VIP, 在接入层,我们的架构做到了可以抵御单可用区故障,并在分钟级自动切换。进入 DNSPod 控制台可以看到 DNSPod 正常解析,对于两个可用区 CLB 的 HTTP 探测任务处于正常状态。







逻辑层

从逻辑层来看,我们将服务分别部署在了两台 CVM 上,并将它们分别部署在广州三区广州四区,CLB 的后端 RS 配置为这两台 CVM 的服务端口,在其中任何一台 CVM 不可用的情况下,服务仍然能够正常对外提供服务。




数据层

从数据层来看,我们使用了常见的存储架构,Redis 作为缓存,CDB 作为持久化存储。为了保证存储层具有跨可用区容灾能力,我们将 Redis、CDB 规格都设置为双节点、一主一备架构,并且主备分属不同可用区。当主可用区故障时,Redis 和 CDB 都将发生主备切换,主备切换期间,服务可能会受到短暂影响,待数据库自动恢复后,服务也能恢复正常。







实验工具

介绍完服务架构,我们还需要一些工具配合我们做演练:
利用混沌平台的演练编排和故障能力,可以帮助我们快速的开展混沌实验。
为了模拟流量请求,我们利用PTS压测平台对服务进行流量压测,我们已经配置好压测场景,它包含了我们网站的一些基本操作(发布新闻、删除新闻、评论、点赞等),我们将通过PTS平台观测我们的接口请求成功率,进而判断我们服务受影响程度。
注意:
PTS 压测平台内测中,需要开白使用。