告警管理是腾讯云数据库 AI 服务(TDAI)提供的告警通知功能,支持用户对智能体实例的任务进行监控,当触发特定事件时,通过多种渠道(站内信、短信、邮件、语音、企业微信、机器人等)及时通知用户,帮助用户快速感知和响应系统异常。
智能体告警场景说明
智能体类型 | 告警场景 | 用户需求 |
高负载止损值守智能体 | 高负载风险阈值触达 | 收到实时告警后,通过告警历史统一入口定位事件,并通过链接进入对话进行处置。 支持历史统计分析。 |
使用限制
一个告警对象可绑定多个告警策略,事件触发时按所有命中策略执行通知。
前提条件
已开通腾讯云数据库 AI 服务。
已创建至少一个高负载止损值守智能体实例。
拥有告警管理的操作权限。
如需接收告警通知,需在访问管理控制台配置接收人信息(手机号、邮箱等)。
新建告警策略
1. 登录 数据库 AI 服务控制台。
2. 在左侧导航栏选择告警管理 > 告警策略。
3. 在页面左上方单击新建策略。
4. 在配置告警策略对话框中按以下步骤完成配置。

4.1 填写基本信息。
配置项 | 说明 | 是否必填 |
策略名称 | 仅支持中文、数字、英文大小写字母、特殊字符-_/()[]+=<:;@,长度不超过60个字符 | 是 |
智能体类型 | 支持选择高负载止损值守智能体。 | 是 |
4.2 选择告警对象。
告警对象支持两种选择方式:
全部对象:该智能体类型下的所有对象。
指定对象:手动选择特定的智能体实例或任务。
选择指定对象后,根据智能体类型进行配置:
配置项 | 高负载止损值守智能体 |
告警对象层级 | 两级(智能体实例 > 数据库实例) |
左侧列表 | 显示所有高负载智能体实例(如:高负载告警测试、高负载、高负载-ddl),支持关键字搜索。 |
右侧详情 | 该智能体实例下的数据库实例。 |
已选择 | 底部显示已选择的告警对象。 |
4.3 选择监控事件。
根据智能体类型,勾选需要监控的事件(支持单选/多选):
智能体类型 | 可选监控事件 |
高负载止损值守智能体 | 高负载阈值触发(highload_threshold_reached) 高负载支持配置告警频率: 只告警一次 每5分钟 每30分钟 每1小时 每3小时 每天 |
4.4 配置用户通知
配置项 | 说明 |
接收对象 | 选择用户:从下拉列表选择接收告警的用户。 选择用户组:从下拉列表选择接收告警的用户组。 说明: |
通知时段 | 设置接收告警的时间段,默认00:00-23:59。 |
接收渠道 | 勾选告警通知渠道(可多选):站内信、短信、邮件、微信、语音、企业微信、机器人。 |
5. 配置完成后,单击提交。
管理告警策略
查看告警策略列表
1. 登录 数据库 AI 服务控制台。
2. 在左侧导航栏选择告警管理 > 告警策略。
3. 查看告警策略列表,列表包含以下字段:
字段 | 说明 |
策略名称 | 策略名称及所属智能体类型(如:test - SQL 变更风险预测智能体)。 单击策略名称可查看该策略绑定的告警对象。 |
监控事件 | 该策略监控的事件类型(如:ddl_after_change_replay_finished, aid_task_completed)。 |
接收对象 | 告警通知接收人的用户 ID。 |
接收渠道 | 通知渠道,包括站内信、短信、邮件、微信、语音、企业微信、机器人。 |
启用状态 | 策略启用/禁用状态开关。 |
操作 | 支持编辑或删除告警策略。 |
启用/禁用策略
1. 在启用状态列找到对应策略的开关。
2. 点击开关切换状态。
开关为蓝色(ON):策略已启用,正常触发告警。
开关为灰色(OFF):策略已禁用,不触发告警。
编辑策略
1. 在操作列单击编辑。
2. 在编辑告警策略窗口,修改需要调整的配置项。
3. 单击提交。
删除策略
1. 在操作列单击删除。
2. 在弹出的确认对话框中,单击确定。
后续步骤
1. 告警响应处理。
收到告警通知后,建议按以下流程处理:
1.1 查看告警详情:登录 数据库 AI 服务控制台,选择告警管理 > 告警历史,查看详细信息。
1.2 定位问题:根据告警中的智能体实例、任务信息定位问题。
1.3 处理问题:点击告警提供的链接,跳转至对应实例/任务进行处理。
1.4 确认恢复:问题处理后,确认系统恢复正常。
2. 策略优化建议。
定期审视告警策略,根据业务变化调整监控事件和告警对象。
合理设置告警频率,避免告警风暴。
设置合适的通知时段,避免非工作时间打扰。
及时清理已下线实例/任务关联的策略。
3. 自动策略更新说明。
平台会自动维护策略与告警对象的关联关系:
场景 | 平台自动处理 |
任务结束 | 自动释放策略中对应的任务或数据库实例。 |
智能体实例删除 | 自动释放策略中对应的智能体实例及其包含的任务/数据库实例。 |
常见问题
Q1:为什么收不到告警通知?
A:请检查:
告警策略是否已启用(开关为开启状态)。
告警对象是否正确配置。
通知时段是否包含当前时间。
接收渠道是否已勾选。
接收对象的联系方式是否在 访问管理 中正确配置。
Q2:如何修改告警接收人的手机号或邮箱?
Q3:一个告警对象可以绑定多个策略吗?
A:可以。一个告警对象可以绑定多个告警策略,当事件触发时,所有命中的策略都会执行告警通知。
Q4:高负载智能体为什么需要设置告警频率?
A:高负载场景可能持续触发告警,设置告警频率可以避免短时间内发送大量重复告警,造成告警风暴。