背景
网络延迟故障是常见的问题之一。故障发生时会导致服务无法正常响应用户请求,影响业务的正常运行。对于依赖高可用和低延迟的业务,网络延迟故障会给用户带来很大的不便和损失。
为了提高 CVM 的网络可靠性和稳定性,需进行网络延迟故障演练。通过演练,可以验证系统在网络延迟情况下是否能够正常运行,提前暴露在此故障场景下的一系列问题,以便于优化系统架构并做好应急预案。
演练实施
步骤一:演练准备
准备若干可以演练的 CVM 实例。
步骤二:演练编排
1. 查看故障注入前的网络状态。使用 ping 命令向目标机器发送报文,并等待目标机器的响应。查看网络延迟情况。![](https://qcloudimg.tencent-cloud.cn/image/document/59b9d44eecbadd69b8d814d144bc4664.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/59b9d44eecbadd69b8d814d144bc4664.png)
2. 登录 云顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练。
3. 单击跳过,新建空白演练。填写演练信息,选择演练目标 CVM 实例。
![](https://qcloudimg.tencent-cloud.cn/image/document/4a795e7f47509c705d5c9b9bfd09548a.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/4a795e7f47509c705d5c9b9bfd09548a.png)
4. 单击立即添加,选择网络资源,单击主机内网络延迟,然后单击下一步。
![](https://qcloudimg.tencent-cloud.cn/image/document/791b67f94bf7cd31596e404cf9849d4b.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/791b67f94bf7cd31596e404cf9849d4b.png)
5. 配置故障动作参数,然后单击确定。
![](https://qcloudimg.tencent-cloud.cn/image/document/cb297e981c5012aa781aaec6cc004f27.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/cb297e981c5012aa781aaec6cc004f27.png)
6. 动作参数配置完成之后,单击下一步。根据实际情况配置护栏策略和监控指标,最后单击提交,完成演练创建。
![](https://qcloudimg.tencent-cloud.cn/image/document/d9e5b38d4305afc5265d1c7818abaa00.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/d9e5b38d4305afc5265d1c7818abaa00.png)
步骤三:执行演练
1. 进入演练详情,单击前往动作组执行。
![](https://qcloudimg.tencent-cloud.cn/image/document/5f01a47638a997249e7982d7b9176cce.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/5f01a47638a997249e7982d7b9176cce.png)
2. 单击执行,开始演练。![](https://qcloudimg.tencent-cloud.cn/image/document/57a368741b946b3b9bd27d3c21e70247.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/57a368741b946b3b9bd27d3c21e70247.png)
3. 点击动作卡片,查看动作执行结果详情。![](https://qcloudimg.tencent-cloud.cn/image/document/be0af313a5213c1d3f540898febec1e9.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/be0af313a5213c1d3f540898febec1e9.png)
4. 查看故障注入后主机网络状态。可以发现,再次 Ping 目标机器的时候,返回的网络包已经发生延迟。![](https://qcloudimg.tencent-cloud.cn/image/document/597d4ef351b6407c9d7086727172d78c.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/597d4ef351b6407c9d7086727172d78c.png)
5. 执行恢复动作,查看恢复动作详情。![](https://qcloudimg.tencent-cloud.cn/image/document/a0b68e597ae63b58c03f23458820c1ca.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/a0b68e597ae63b58c03f23458820c1ca.png)
6. 查看恢复效果。再次 Ping 目标机器时可以看到,故障已经清除,网络速率恢复正常。![](https://qcloudimg.tencent-cloud.cn/image/document/c604c330d6f5378fd9c1b54f86d2807e.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/c604c330d6f5378fd9c1b54f86d2807e.png)