监控告警能力概述

最近更新时间:2024-12-31 17:04:02

我的收藏
根据产品所提供的专业集群规格使用限制,下面提供一些建议关注的指标和告警项,供您参考。

核心指标及影响

维度
告警项
配置建议
超限影响
主题
消息积压已使用配额百分比
80%
超限后会出现发送失败,客户端反复重连。
消息生产条数已使用配额百分
80%
默认单分区5000 TPS,超限后服务端会延迟返回,客户端发送耗时会增加。
消息生产流量已使用配额百分比
80%
默认单分区40 Mbps,超限后服务端会延迟返回,客户端发送耗时会增加。
消息消费条数已使用配额百分比
80%
默认单分区5000 TPS,超限后可能由于消息推送速率限制,导致消息堆积。
消息消费流量已使用配额百分比
80%
默认单分区40 Mbps,超限后可能由于消息推送速率限制,导致消息堆积。
生产者数量
800
默认单分区生产者数量上限1000,超限后无法创建新的生产者。
消费者数量
1500
默认单分区消费者数量上限2000,超限后无法创建新的消费者。
订阅
未确认消息数已使用配额百分比
80%
默认单订阅单分区5000,超限后,服务端会停止推送消息,直到客户端将 unack 消息确认完成。
消费者数量
800
默认单个订阅在单分区消费者数量上限1000,超限后无法创建新的消费者。
实例
【专业版】专业集群固定存储存储使用率
80%
超限后会出现发送失败,集群无法写入。
【专业版】Pulsar 集群 TPS 使用占比
80%
超限后会造成集群高负载运行,存在稳定性风险。
【专业版】每分钟租户限流写入请求受限次数
1
出现限流后,服务端会延迟返回,会导致发送耗时增加。