SRE 数字分身,专属于您的数字分身,为您提供7 × 24小时不间断的个性化智能服务。通过配置资源地图,让 AI 探索更精准;智能巡检能主动挖掘未知风险;告警分析能第一时间锁定告警原因;还可以自定义任务,将探索能力固化为工作流。
前提条件
在使用本功能前,需要完成以下工作:
完成服务授权。
接受 AI 工作台服务条款。
以上两项都会在用户首次使用 AI 工作台时,以弹窗的形式给出操作界面,您根据弹窗提示操作即可。后续使用时可不用确认。
创建数字分身
1. 登录 腾讯云可观测平台。
2. 在左侧菜单栏中选择 AI 工作台 > SRE 数字分身。
3. 在 SRE 数字分身首页,单击去创建。

4. 进入 SRE 数字分身配置页面,完成相关配置项的填写。

配置项说明如下:
参数 | 说明 |
名称 | 给数字分身起个名字。 |
岗位 | 选择数字分身的工作岗位,建议与使用者的岗位保持一致,以便得到更精准的分析。 |
日志保留 | 数字分身的工作日志内容保留的最长时间,仅支持配置0 - 90天。 |
资源 | 分为手动选择和上传资源两种方式,目前仅支持手动选择。 |
云产品资源 | 选择关注的云产品具体资源,支持添加不同云产品类型的多个实例。 |
应用性能监控 | 选择应用性能监控的业务系统和应用,支持添加不同地域的多个业务系统。 |
Prometheus | 选择 Prometheus 实例,支持添加不同地域的多个 Prometheus 实例。 |
通知方式 | 选择通知模板,数字分身的工作内容结果,将会以对应方式通知给指定人。 |
配置工作任务
1. 在 SRE 任务页面,单击添加任务。

2. 选择工作内容,当前已支持告警分析、告警治理、自定义任务三种任务类型,后续会支持健康巡检。
配置要分析的告警策略,以及分析结果的同步方式。当对应策略触发告警时,SRE 数字分身将自动进行分析,并将分析结果通知用户。

配置项说明如下:
参数 | 说明 |
任务名称 | 填写任务的简要描述,仅支持中英文、数字、下划线。 |
监控类型 | 选择告警策略所属的监控产品类型,当前仅支持云产品监控、应用性能监控、前端性能监控。 |
策略类型 | 选择监控对象的类型,例如云服务器/基础监控。 |
告警策略 | 选择要分析的告警策略名称,该策略触发告警时,SRE 数字分身将自动执行分析任务。 |
同步方式 | 选择告警分析结果的同步方式,分为定时同步和即时同步。 定时同步是指按固定的时间发送通知。 即时同步是指分析完成后立马发送通知。 |
发送周期 | 若选择了定时同步,需要选择发送周期,分为每天和每周。 |
发送时间 | 选择具体的发送时间,精确到小时与分钟。 |
告警治理会基于 SRE 数字分身的资源地图进行告警覆盖度与告警合理性分析,生成告警治理报告,支持定期发送通知。

配置项说明如下:
参数 | 说明 |
任务名称 | 填写任务的简要描述,仅支持中英文、数字、下划线。 |
发送周期 | 若选择了定时同步,需要选择发送周期,分为每天和每周。 |
发送时间 | 选择具体的发送时间,精确到小时与分钟。 |
管理工作任务
在 SRE 任务页面,支持对已创建的任务进行编辑或删除操作。

查看工作日志
1. 单击工作日志,可查看该数字分身的工作情况。
2. 单击操作列的查看,可查看详细的工作结果。

3. 单击报告中的查看会话,可跳转到该任务执行的会话详情页,查看详细的分析过程与结果。

管理数字分身

单击发起会话,跳转到 AI 探索页面,基于该数字分身进行个性化的精细探索。
单击编辑,可修改数字分身的配置项。
单击复制,复制该数字分身的配置项,创建新的数字分身。
单击关闭,可选择永久关闭数字分身,或者暂停数字分身。

