TDMQ RabbitMQ 版提供完善的多维度可观测性体系,涵盖基础的监控告警、变更记录等核心功能,同时支持 Prometheus 监控、智能巡检等增强能力,为用户提供从资源指标到业务状态、从实时监控到历史回溯的全方位可观测能力,确保业务稳定运行。
监控告警
监控能力
TDMQ RabbitMQ 版默认提供基于腾讯云可观测平台服务的资源监控和告警能力,可以对您账户下创建的资源进行实时监控,例如集群、节点、Vhost、Queue 和 Exchange 等,您可以通过这些监控数据了解集群的各类业务请求、资源占用、流量、连接数和消息积压等信息,以便更好地协助您判断集群容量水位及提前感知风险。
TDMQ RabbitMQ 版所支持的监控能力范围如下:
类型 | 适用集群类型 | 能力描述 | 适用场景 |
基础监控 | 所有集群 | 通过基础监控,您可以查看集群、节点、Vhost、Queue 和 Exchange 五个维度的监控指标。 | 集群级指标观测,用于辅助异常问题发现、集群容量规划等运维场景需求。 |
Prometheus 监控 | 开源托管版集群 | 提供 Prometheus Exporter 抓取节点的指标信息,包括但不限于 Queue、Channel、Connection 等基本监控度量指标,以及 Broker JMX 暴露出的度量指标。 | 提供开源兼容的监控被集成方案,支持与用户自有运维平台集成和对接。 |
告警能力
TDMQ RabbitMQ 版不仅为运行中的资源提供了多项监控指标,用于监测集群的运行情况,还提供了关键指标的配置告警功能。您可以为监控指标配置告警规则,创建的告警会将一定周期内监控的指标与给定阈值的情况进行比对,当监控指标达到设定的报警阈值时,可观测平台可以通过邮件、短信、微信、电话等方式通知您,您可以及时采取相应的预防或补救措施,合理地配置告警规则能帮助您提高应用程序的健壮性和可靠性。
智能巡检(仅开源托管版支持)
TDMQ RabbitMQ 版推出的智能巡检能力,能够主动排查集群问题和隐患,并基于专家经验沉淀给出问题解决方案,自动归纳健康检查结果生成报告。帮助用户提取关键信息、高效定位问题、提供专业解决建议,实现运维体验闭环。
变更记录(仅开源托管版支持)
变更记录将 TDMQ RabbitMQ 版所生成的变更事件数据进行集中的管理、存储、分析和可视化展示,便于日后查询、审计和回溯,您可以在变更记录模块内查看变更记录的详细信息。