预设告警策略

最近更新时间:2025-05-30 11:48:02

我的收藏

简介

腾讯云可观测平台提供了基于专家经验的预设告警策略,支持用户一键开启快速应用,帮助用户降低配置门槛,快速对资源进行告警覆盖。同时用户也可以根据需要调整预设告警策略的配置内容,更贴近业务实际场景。

预设策略详解

配置预设告警策略

配置项
说明
策略名称
预设策略名称的命名规范是:产品名+预设告警策略,例如“云联网带宽预设告警”
监控范围
自动覆盖当前及未来新增的指定产品资源
触发条件
指标(CPU/内存等)+ 阈值 + 1分钟检测粒度 + 通知周期(每一小时重复通知一次)
通知渠道
预设通知对象是“系统预设通知模版”,也就是主账号的通知渠道(可自定义修改)

编辑预设告警策略

可修改项:告警策略基本信息、触发条件配置、告警接收人配置。
重置机制:支持一键重置。另外,关闭预设策略后重新启用将恢复初始配置。

管理告警预设策略

管理入口预设告警策略列表有对不同产品类型的预设策略,用户进行一键开启后会同步在告警策略列表内创建一条对应的告警策略。
创建/删除操作:在管理预设告警页面启用预设策略后,告警策略列表中会同步创建一条告警策略。后续关闭预设策略,这条告警策略也会同步删除。

临时关闭/开启操作:用户可以在告警策略列表中对告警策略进行启停操作,满足暂时开启/关闭的需求。


实践指南

一键开启

2. 选择告警管理 > 告警配置,在告警策略页面单击管理预设策略

3. 管理预设策略页面选择产品(如云服务器、数据库),确认配置信息后启用。


预设告警策略列表

策略类型
告警规则
云服务器-基础监控
CPU 利用率 > 95%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
内存利用率 > 95%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
磁盘利用率 > 95%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
外网出带宽使用率 > 95%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
私有网络-云联网-地域间
地域间出带宽利用率 > 80%,统计粒度1分钟,连续3次满足条件则每1小时告警一次
地域间出丢包率 > 0%,统计粒度1分钟,连续1次满足条件则只告警一次
云数据库-MySQL-主机监控
磁盘利用率(主机监控)环比波动 >= 80%,统计粒度5分钟,连续3次满足条件则每1天告警一次
CPU 利用率 > 80%,统计粒度1分钟,连续3次满足条件则每1小时告警一次
主从延迟时间 = 86400秒,统计粒度1分钟,连续3次满足条件则每1小时告警一次
主从延迟距离 > 25600MB,统计粒度1分钟,连续3次满足条件则每1小时告警一次
消息服务 CKafka-实例(Serverful 形态)
当前磁盘占用与实例规格磁盘总容量的百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
实例连接数百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
实例消费带宽百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
实例生产带宽百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
实例 topic 百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
实例 partition 百分比 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
Elasticsearch 服务-ES 集群
平均 CPU 使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
集群维度磁盘平均使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
平均 JVM 内存使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
集群健康状态 = 1,统计粒度1分钟,连续3次满足条件则每1小时告警一次
云数据库-Redis-内存版(5秒粒度)-实例汇总
接使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
CPU 使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
入流量使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
内存使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
出流量使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
节点最大内存使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
节点最大 CPU 使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
云数据库-MariaDB-实例汇总
CPU 利用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
数据磁盘空间利用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
IO 利用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
最大 DB 连接使用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
最大备节点 CPU 利用率 > 80%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
云数据库-TDSQL-C-MySQL
内存使用率 > 90%,统计粒度1分钟,连续5次满足条件则每1小时告警一次
数据表空间使用率 > 90%,统计粒度1分钟,连续5次满足条件则每1小时告警一次