背景
网络故障是 Kubernetes 最常见的故障类型之一,定位排查也较为困难,一般需要专业的运维人员介入处理。为此,云顾问 - 混沌演练提供了网络乱序、网络重复、网络丢包、网络延迟、网络 DNS 异常五类故障,您可通过以上动作独立完成业务上网络性能的稳定,保障服务正常运行。
演练实施
演练准备
购买 标准集群 容器实例,部署测试服务。
进入 探针管理 页面安装探针。
演练步骤
步骤1:创建演练
1. 登录 云顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练。
2. 单击跳过,新建空白演练,并填写演练信息。
步骤2:添加演练实例和动作
标准集群普通节点 Node 类型故障添加
1. 在演练对象配置环节中,选择对象类型容器——标准集群普通节点。
![](https://qcloudimg.tencent-cloud.cn/image/document/d457d7fae9f1153d73402e3dad5ba413.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/d457d7fae9f1153d73402e3dad5ba413.png)
2. 添加标准集群普通节点 Node 实例。选择需要注入的集群 ID,将会自动拉起该集群下的 Node 节点。
![](https://qcloudimg.tencent-cloud.cn/image/document/f1bebff1c5cbb567fc6d673befb5b17e.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/f1bebff1c5cbb567fc6d673befb5b17e.png)
3. 添加演练动作。选择网络资源下的网络延迟故障动作。
![](https://qcloudimg.tencent-cloud.cn/image/document/620b5c33af964875c877b98e6118b5a4.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/620b5c33af964875c877b98e6118b5a4.png)
4. 配置动作参数。
![](https://qcloudimg.tencent-cloud.cn/image/document/cb9c80e888ad39732ab576a3665ff427.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/cb9c80e888ad39732ab576a3665ff427.png)
Pod 类故障添加
1. 选择对象类型容器——标准集群 Pod。
![](https://qcloudimg.tencent-cloud.cn/image/document/2b03487277fc356af0f07a7fde706ac2.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/2b03487277fc356af0f07a7fde706ac2.png)
2. 添加 Pod 实例,依次选择需要注入的集群 ID > 负载类型(工作负载) > 命名空间 > 负载名称(Workload)之后,便可以选择满足筛选条件的 Pod 实例。
![](https://qcloudimg.tencent-cloud.cn/image/document/036b7bc2f1aea40dfe317ed9060d957f.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/036b7bc2f1aea40dfe317ed9060d957f.png)
3. 选择网络资源下的网络延迟故障动作。
![](https://qcloudimg.tencent-cloud.cn/image/document/e21f8174a1a1abf19d2ef4004942a993.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/e21f8174a1a1abf19d2ef4004942a993.png)
4. 配置故障动作参数。在该页面可以配置是否开启 Container 故障,若开启,输入容器名称之后,便可向指定容器注入故障。
![](https://qcloudimg.tencent-cloud.cn/image/document/e174523f486eaee223931e65755cddea.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/e174523f486eaee223931e65755cddea.png)
步骤3:配置监控(可选)
可在全局配置阶段选择监控指标,勾选所需要配置的监控指标进行添加。
![](https://qcloudimg.tencent-cloud.cn/image/document/8dc2e9f8f97dc2baf368d0e0d858017d.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/8dc2e9f8f97dc2baf368d0e0d858017d.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/bf14cca275bc62126d7162418c327a85.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/bf14cca275bc62126d7162418c327a85.png)
步骤4:执行演练
单击执行演练,由于网络动作为高风险动作,需完成身份验证后方可执行动作。
![](https://qcloudimg.tencent-cloud.cn/image/document/d50f5545617a2bebedcf041d8f42d529.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/d50f5545617a2bebedcf041d8f42d529.png)