背景
Pod 是 Kubernetes 集群中运行的应用程序的最小部署单元。在实际应用场景中,Pod 可能存在容器崩溃、资源不足、Pod 销毁、Pod 宕机等故障,导致应用程序无法正常运行。
为了提高容器服务的可靠性和稳定性,需进行 Serverless Pod 故障演练。通过演练,可以验证服务在 Pod 故障的情况下是否可以正常提供服务,提前暴露在此故障场景下的一系列问题,以便提升业务的稳定性。
演练实施
步骤一:演练准备
在可用的容器实例上,部署测试服务。若已有可以演练的容器实例,则直接创建演练。
进入 探针管理 页面安装探针。
步骤二:创建演练
1. 登录 智能顾问控制台 > 架构治理,进入治理模式,点击混沌演练。(详细创建演练方式请参阅 使用智能顾问进行混沌演练 )

2. 点击新建演练,填写演练基本信息,完成后点击下一步。

3. 在演练实例中,选择容器-Serverless 集群 Pod,选择后点击搜索添加,添加实例资源。亦可通过架构图添加方式,直接点击架构图上的 TKE 资源,选择实例进行添加。

4. 完成添加实例后,点击添加动作,在 Pod 操作分类下,选择故障动作 Pod Failure,点击下一步。

5. 设置动作参数,点击确定。


6. 参数配置完成之后,在全局配置中选择执行方式、护栏策略,及添加可观测指标。配置完成后,点击提交,即可完成演练任务创建。

步骤三:执行演练
1. 进入演练详情,点击故障动作组中的执行,或下方开始演练,注入故障。

2. 查看动作执行结果。
3. 点击动作卡片,查看执行日志,确认执行成功。

