操作场景
TDMQ Pulsar 版不仅为运行中的资源提供了多项监控指标,用于监测集群的运行情况,还提供了关键指标的配置告警功能。您可以为监控指标配置告警规则,创建的告警会将一定周期内监控的指标与给定阈值的情况进行比对,当监控指标达到设定的报警阈值时,可观测平台可以通过邮件、短信、微信、电话等方式通知您,您可以及时采取相应的预防或补救措施,合理地配置告警规则能帮助您提高应用程序的健壮性和可靠性。
告警配置建议
本节为您介绍在使用 TDMQ Pulsar 版过程中需要重点关注的一些指标及其告警配置建议,您可以根据业务需要进行配置:
维度 | 告警项 | 告警配置建议 | 超限影响 |
主题 | 消息积压已使用配额百分比 | 80% | 超限后会出现发送失败,客户端反复重连。 |
| 消息生产条数已使用配额百分比 | 80% | 默认单分区5000 TPS,超限后服务端会延迟返回,客户端发送耗时会增加。 |
| 消息生产流量已使用配额百分比 | 80% | 默认单分区40 Mbps,超限后服务端会延迟返回,客户端发送耗时会增加。 |
| 消息消费条数已使用配额百分比 | 80% | 默认单分区5000 TPS,超限后可能由于消息推送速率限制,导致消息堆积。 |
| 消息消费流量已使用配额百分比 | 80% | 默认单分区40 Mbps,超限后可能由于消息推送速率限制,导致消息堆积。 |
| 生产者数量 | 800 | 默认单分区生产者数量上限1000,超限后无法创建新的生产者。 |
| 消费者数量 | 1500 | 默认单分区消费者数量上限2000,超限后无法创建新的消费者。 |
订阅 | 未确认消息数已使用配额百分比 | 80% | 默认单订阅单分区5000,超限后,服务端会停止推送消息,直到客户端将 unack 消息确认完成。 |
| 消费者数量 | 800 | 默认单个订阅在单分区的消费者数量上限1000,超限后无法创建新的消费者。 |
集群 | 【专业集群】固定存储-存储使用率 | 80% | 超限后会出现发送失败,集群无法写入。 |
| 【专业集群】Pulsar 集群 TPS 使用占比 | 80% | 超限后会造成集群高负载运行,存在稳定性风险。 |
| 【专业集群】每分钟租户限流写入请求受限次数 | 1 | 出现限流后,服务端会延迟返回,导致发送耗时增加。 |
管理默认告警策略
TDMQ Pulsar 版预设了多维度的默认告警策略,您可在腾讯云可观测平台上查看并修改这些默认策略,也可以针对业务情况设置自定义策略,快速开启集群告警监测。
1. 登录腾讯云可观测平台。
2. 在左侧导航栏选择告警管理 > 告警配置,在告警策略页面左侧的策略类型中选择消息队列 TDMQ-Pulsar,可以查看到实例下的默认策略和自定义策略。
3. 通过选择左侧的告警类型,可以查看分类下的预设策略和自定义策略。
4. 您也可以通过单击左上角的新建策略创建您的自定义策略,详细操作与介绍请参见新建告警策略。

配置自定义告警策略
步骤1:进入配置告警页面
Pulsar 配置告警规则有两个不同的入口:监控页面配置告警、腾讯云可观测平台配置告警。
入口一:登录 TDMQ Pulsar 版控制台,在集群管理中,单击目标集群的“ID”,在详情页选择监控信息页签,单击右上角的配置告警按钮可以跳转到告警配置页面,页面默认设定的告警对象是当前集群。

入口二:登录腾讯云可观测平台控制台,在告警配置页面可以查看所有预设策略和自定义策略,单击新建策略,监控类型选择云产品监控,策略类型选择消息队列 TDMQ/Pulsar。
步骤2:设置告警规则
1. 进入告警策略配置页面后,选择您要设置告警的对象。
所属标签:可以根据标签批量筛选您想配置告警策略的资源。
告警对象:选择需要配置告警策略的 Pulsar 资源。
2. 设置告警触发条件,支持选择模板和手动配置,默认选择手动配置。
指标:例如“集群生产带宽峰值”,选择统计粒度为1分钟,则在1分钟内,集群生产带宽峰值连续N个数据点超过阈值,就会触发告警。
告警频次:例如“每30分钟警告一次”,指每30分钟内,连续多个统计周期指标都超过了阈值,如果有一次告警,30分钟内就不会再次进行告警,直到下一个30分钟,如果指标依然超过阈值,才会再次告警。
1. 勾选选择模板后,单击新建触发条件模板,跳转到设置触发条件模板页面。
2. 在左上角单击新建触发条件模板,在新建模板页面,配置告警策略。
策略类型:选择消息队列 TDMQ/Pulsar。
触发条件:根据我们提供的告警策略建议或者您实际的业务需求,设置好告警策略。
3. 确认无误后,单击保存。
4. 返回新建告警策略页,单击刷新,就会出现刚配置的告警策略模板。

说明:
3. 单击下一步:配置告警通知,配置告警通知人。
步骤3:配置告警通知
在配置告警通知页面,您可以选择系统预设的通知模板,预设模板的告警对象通常为主账号负责人。如您需要通知到实例负责人或其他人员,也可以单击新建模板来新建通知模板,设置告警接收对象和接收渠道。