探针管理

最近更新时间:2024-06-27 17:56:21

我的收藏
为了更好的支持主机和容器进行丰富的故障动作,将会通过故障探针对目标资源实现故障注入。用户可以通过 混沌演练 > 探针管理 自主管理故障探针。

操作步骤

选择操作的探针类型

目前 混沌演练平台 支持两种对象类型自主管理探针:云服务器CVM 容器服务TKE




安装探针

云服务器 CVM

1. 选择需要进行新增探针的地域,点击新增探针
说明:
当前不支持在以下操作系统版本中安装探针:Ubuntu 20.04、Ubuntu 22.04、Ubuntu Server 24.04 LTS 64位、Debian 11.1、Debian 11.4、Debian 12.0、Windows(所有版本)、OpenCloudOS(所有版本)、AlmaLinux(所有版本)以及 Fedora(所有版本)。



2. 勾选需要安装探针的机器实例后,点击下一步进行机器检测。



3. 检测通过后,如果机器状态存在可安装、待升级。则可以点击开始安装/升级,对于目标机器进行探针安装。


4. 开始安装后,请耐心等待机器探针安装,安装成功后点击关闭即可对机器资源进行故障注入。




容器服务 TKE

1. 点击容器服务TKE选项卡,页面中将会展示当前地域下的故障探针。



2. 选择需要进行新增探针的地域,点击新增探针



3. 勾选需要安装探针的集群,点击下一步混沌演练平台将会在指定集群内检测是否满足安装探针的条件。



4. 检测结果可安装、待升级,则满足安装探针的条件,可点击开始安装/升级,将会对符合条件的集群安装探针。如果不满足探针条件,请参考备注中的检测结果说明进行修复。


5. 安装成功后,即可开始对集群模拟 Node、Pod 的故障。具体操作请参考文档 标准集群 Node 与 Pod 网络故障模拟。




卸载探针

批量卸载

1. 进入探针管理对应的资源类型下,勾选需要卸载资源,点击批量卸载发起卸载探针操作。



2. 当探针状态变为未安装,则表示探针已成功卸载。




单独卸载

1. 可以通过列表中找到已安装探针的探针,点击卸载,发起探针卸载操作。



2. 安装/卸载过程中,若探针状态未能及时更新,可以点击上方刷新图标进行手动刷新。




删除探针

需要删除混沌演练平台中的探针记录,需要先将已安装探针的资源进行卸载。探针状态变为未安装,即可对记录中的操作项删除,发起删除探针记录的操作。