SRE 数字分身

最近更新时间:2025-09-19 12:13:52

我的收藏
SRE 数字分身,专属于您的数字分身,为您提供7 × 24小时不间断的个性化智能服务。通过配置资源地图,让 AI 探索更精准;智能巡检能主动挖掘未知风险;告警分析能第一时间锁定告警原因;还可以自定义任务,将探索能力固化为工作流。

前提条件

在使用本功能前,需要完成以下工作:
完成服务授权。
以上两项都会在用户首次使用 AI 工作台时,以弹窗的形式给出操作界面,您根据弹窗提示操作即可。后续使用时可不用确认。

创建数字分身

2. 在左侧菜单栏中选择 AI 工作台 > SRE 数字分身
3. 在 SRE 数字分身首页,单击去创建

4. 进入 SRE 数字分身配置页面,完成相关配置项的填写。

配置项说明如下:
参数
说明
名称
给数字分身起个名字。
岗位
选择数字分身的工作岗位,建议与使用者的岗位保持一致,以便得到更精准的分析。
日志保留
数字分身的工作日志内容保留的最长时间,仅支持配置0 - 90天。
资源
分为手动选择和上传资源两种方式,目前仅支持手动选择。
云产品资源
选择关注的云产品具体资源,支持添加不同云产品类型的多个实例。
应用性能监控
选择应用性能监控的业务系统和应用,支持添加不同地域的多个业务系统。
Prometheus
选择 Prometheus 实例,支持添加不同地域的多个 Prometheus 实例。
通知方式
选择通知模板,数字分身的工作内容结果,将会以对应方式通知给指定人。

配置工作任务

1. SRE 任务页面,单击添加任务

2. 选择工作内容,当前已支持告警分析告警治理自定义任务三种任务类型,后续会支持健康巡检
告警分析
告警治理
自定义任务
配置要分析的告警策略,以及分析结果的同步方式。当对应策略触发告警时,SRE 数字分身将自动进行分析,并将分析结果通知用户。

配置项说明如下:
参数
说明
任务名称
填写任务的简要描述,仅支持中英文、数字、下划线。
监控类型
选择告警策略所属的监控产品类型,当前仅支持云产品监控、应用性能监控、前端性能监控。
策略类型
选择监控对象的类型,例如云服务器/基础监控。
告警策略
选择要分析的告警策略名称,该策略触发告警时,SRE 数字分身将自动执行分析任务。
同步方式
选择告警分析结果的同步方式,分为定时同步和即时同步。
定时同步是指按固定的时间发送通知。
即时同步是指分析完成后立马发送通知。
发送周期
若选择了定时同步,需要选择发送周期,分为每天和每周。
发送时间
选择具体的发送时间,精确到小时与分钟。
告警治理会基于 SRE 数字分身的资源地图进行告警覆盖度与告警合理性分析,生成告警治理报告,支持定期发送通知。

配置项说明如下:
参数
说明
任务名称
填写任务的简要描述,仅支持中英文、数字、下划线。
发送周期
若选择了定时同步,需要选择发送周期,分为每天和每周。
发送时间
选择具体的发送时间,精确到小时与分钟。
自定义任务,支持基于 AI 探索保存个性化的分析任务。
单击去 AI 探索创建,跳转到 AI 探索页面,选择分身,发起对话,对话结束后再 添加任务到数字分身


管理工作任务

在 SRE 任务页面,支持对已创建的任务进行编辑删除操作。


查看工作日志

1. 单击工作日志,可查看该数字分身的工作情况。
2. 单击操作列的查看,可查看详细的工作结果。

3. 单击报告中的查看会话,可跳转到该任务执行的会话详情页,查看详细的分析过程与结果。


管理数字分身


单击发起会话,跳转到 AI 探索页面,基于该数字分身进行个性化的精细探索。
单击编辑,可修改数字分身的配置项。
单击复制,复制该数字分身的配置项,创建新的数字分身。
单击关闭,可选择永久关闭数字分身,或者暂停数字分身