监控概述

最近更新时间:2025-10-31 10:55:42

我的收藏

功能介绍

云数据库 MongoDB 的监控能力基于腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP) 构建。TCOP 是一项集监控与告警于一体的云服务,能够持续采集并汇聚云产品的各项指标数据。更多信息,请参见 腾讯云可观测平台
功能
具体描述
相关内容
监控指标
通过可视化图表与实时趋势图,动态展示资源、网络及性能指标,助力直观掌握数据库健康状态,为性能优化与容量规划提供关键依据。
指标告警
支持为关键监控指标设置自定义阈值。当资源使用率或性能数据触发规则时,系统通过多种渠道自动发送通知,实现从被动处理到主动预防的风险管理。
事件告警
实时监控并推送数据库实例内部发生的特定系统事件(如主从切换、节点故障)。致力于在运维人员发现前主动通知异常,助力快速响应可能影响业务稳定性的突发状况,提升运维效率。

监控数据粒度与保留策略说明

为平衡查询性能与存储成本,监控系统采用分级存储策略。您可查询的时间范围决定了系统所能提供的数据粒度,不同粒度的数据其保留时长也不同。
监控时间粒度
支持查询的时间跨度
数据保留时长
应用场景
5秒
0天 - 1天
1天
实时诊断:用于秒级问题定位,分析瞬时流量毛刺与性能抖动。
1分钟
0天 - 1天
15天
短期分析:分析几小时至数日内的性能趋势。
5分钟
0天 - 1天
31天
日常运维:观察日级别的整体负载与资源消耗情况。
1小时
0天 - 7天
93天
周度/月度回顾:分析周、月维度的业务负载与资源规划。
1天
0天 - 30天
186天
长期趋势与容量规划:用于季度、半年的资源使用趋势分析与预算制定。

监控范围

监控类别
监控范围
实例(主实例、只读实例、灾备实例)
节点
Mongod
Mongos
资源监控
统计整个集群的所有节点 CPU 与内存的最大使用率、平均使用率,及其磁盘使用率。
统计集群中存储文档的 Mongod 节点的 CPU、内存及磁盘的使用率。
统计集群中存储文档的 Mongos 节点的 CPU 与内存的使用率。
网络监控
统计整个集群出入流量的字节数、及其客户端连接数量。
统计 Mongod 节点出入的字节数。
统计 Mongos 节点出入的字节数。
时延监控
统计请求从下发到集群至最终返回所产生的耗时。
统计请求到达 Mongod 节点再从 Mongod 返回整个过程的平均耗时。
统计请求到达 Mongos 节点,经 Mongos 路由至 Mongod,再经过 Mongod 计算处理,最终从 Mongos 返回整个过程的平均耗时。
请求监控
统计所有下发至集群的请求数量及每秒的请求数量。
统计访问 Mongod 的请求数量及每秒的请求数量。
统计 Mongos 节点收到的请求数量及每秒收到请求数量。
内核监控
-
统计包含:活跃读写请求数量、读写排队长度、TTL、主从延迟、Cache 命中率等。
-

计费说明

腾讯云可观测平台服务基础功能免费,包括告警、采集监控数据等。
腾讯云可观测平台于2022年09月01日00:00:00开始对部分 API 接口的请求进行计费。具体信息,请参见 API 计费说明
告警管理针对告警短信、电话告警服务计费。具体信息,请参见 购买告警短信服务购买电话告警服务