告警管理

最近更新时间:2026-01-30 11:23:44

我的收藏
告警管理指按照预设告警策略,自动检测各类监控指标数据是否达到异常阈值,并按照指定的方式向目标人员推送告警信息的机制。告警管理能实现对系统运行状态的实时监控和异常情况的快速响应,有助于提升运维效率,降低人工监控成本,能够及时发现并处理潜在问题。

功能入口

登录 腾讯云智能体开发控制台,进入某个工作空间后,在导航栏中找到运维管理。单击告警管理,即可进入当前空间的告警管理页面。
说明:
1. 仅拥有对应功能权限的用户可查看或添加新的告警策略,确保数据安全。
2. 空间级告警管理功能权限请前往“平台端用户权限”进行配置。


新建告警策略

单击新建告警策略,进入配置页面,需完成基础信息、触发条件、告警通知三部分配置,配置完成后单击确定即可创建策略。


基础信息配置

配置
说明
告警策略名称
自定义策略名称,用于区分不同告警规则。
告警等级
表示本次告警的严重程度,支持“一般”、“严重”、“致命”三种,默认为“一般”。
生效时间
表示该策略的生效时间范围,在该时间范围内会监测异常情况并告警。

触发条件配置

触发条件是告警的核心判断规则,支持单条件或多条件配置,最多支持添加 10 个条件,条件间为 “或”的关系,即任一条件满足时触发告警。针对任意一条告警策略,需同时满足触发的条件与频次才会触发告警。
配置
说明
条件
被监控的核心指标,需设置“监控对象”、“逻辑判断条件”与“阈值”。当监控对象达到逻辑判断条件的阈值时,触发告警策略。目前,监控对象含有以下两类:
某个模型的 Tokens 单日用量。
某个模型的 TPM。
频次
频次支持配置“时间范围”、“计算方式”、与“次数”。逻辑含义为在一段时间内累计或连续触发一定数量的异常情况。

告警通知

告警通知是平台在监测到指标达到告警策略预设阈值时,通过短信、邮件等指定渠道,向运维人员推送的异常提醒信息,实现异常的及时触达。目前支持短信与邮件两种告警通知方式。

配置告警通知前,用户需授权腾讯云的短信或邮箱产品。

接入短信

用户需开通腾讯云短信产品,并完成资质、创建短信签名、正文模板并通过审核,详细的申请流程请参见 国内短信快速入门
配置
说明
通知模板
告警通知的具体短信正文内容模板。
短信 SdKAppId
在【短信控制台】添加应用后生成的实际 SdkAppId。
短信签名
在【签名管理】中查看,使用 UTF-8编码,必须填写已审核通过的签名。
通知对象
通知对象的11位手机号,添加多个手机号时,需以逗号或分号分隔。

接入邮件

用户需开通腾讯云邮件推送功能,配置发信域名、发信地址及发信模板,详细流程请参见 邮件配置
配置
说明
通知模板
告警通知的具体邮件正文内容模板。
发件人邮箱
发送邮件者的邮箱地址。
收件人邮箱
通知对象的邮箱,添加多个邮箱时,需以逗号或分号分隔。
注意:
告警策略仅在启用状态下才会触发告警,未启用的策略不会被监控。