有奖捉虫:云通信与企业服务文档专题,速来> HOT
告警触发条件是指标、比较关系、阈值、统计粒度和持续 N 个监控数据点组成的一个有语义的条件,用户可以根据图表中指标变化趋势设置告警触发条件。例如,指标为 CPU 利用率 、比较关系为 > 、阈值为80% 、统计粒度为5分钟 、持续监控数据点为2个数据点,表示每5分钟收集一次 CPU 利用率数据,若某台云服务器的 CPU 利用率连续两次大于80%则触发告警。
腾讯云可观测平台支持用户自定义配置指标告警事件告警,同时提供告警触发条件模板功能,支持用户快速复用预置的告警触发条件。

告警触发逻辑说明

告警生命周期解析

指标在持续 N 个数据点达到阈值即是⼀次告警⽣命周期的开始,在告警未恢复前,将根据配置的发送频率发送告警消息(若24小时内告警未恢复,系统会按您配置的频率例如:每1小时、2小时等发送告警;告警超过24小时未恢复,则每天告警一次);如果告警恢复,您将会收到恢复消息,本次告警⽣命周期结束。再次触发则进⼊新的告警周期。

告警生命周期示意图

静态阈值

以3个监控数据点持续大于阈值即触发为例: 下图为一个告警生命周期,当持续三个监控数据点(如下图三个红点)达到阈值后触发告警,红色线段为告警时间段,此段时间会根据您设置的频率发送告警通知;当持续三个监控数据点(如下图三个绿色点)恢复正常后告警恢复,停止发送告警消息。即告警生命周期结束,需要再次持续三个监控数据点达到阈值才会触发告警。




静态阈值(环比)

静态阈值(环比)包含环比上升环比下降环比波动三种比较关系,计算方式如下所示:
环比上升:与前一个监控数据点相比,持续 n 个数据点的增长率大于阈值,其中增长率 = (当前数据值-上个数据值) / 上个数据值。
环比下降:与前一个监控数据点相比,持续 n 个数据点的下降率大于阈值,其中下降率 = (上个数据值-当前数据值) / 上个数据值。
环比波动:与前一个监控数据点相比,持续 n 个数据点的变化率绝对值大于阈值,其中变化率绝对值 = | (当前数据值-上个数据值) / 上个数据值 | 。
以3个监控数据点持续环比上升达到阈值即触发为例: 环比上升表示本统计周期与上一统计周期相比持上升状态。当持续三个监控数据与前一个监控数据点相比,增长率大于阈值时触发告警(如下图第一个红点和前一个蓝点相比上升 N%,以此类推)。
红色线段为持续满足环比上升条件,处于告警时间段。当持续三个监控数据点不满足环比上升(第一个绿点和第三个绿点相比前一个数据点,呈下降趋势),或处于环比上升但环比增长率达不到阈值,告警恢复正常,停止发送告警消息。



动态阈值

以3个监控数据点持续达到阈值即触发为例: 如下图当持续三个监控数据点不满足监控数据历史变化规律后触发告警,红色线段为持续不满足历史变化规律,处于告警时间段。当持续三个数据点恢复监控数据历史变化规律后告警恢复正常,停止发送告警消息。