监控概述

最近更新时间:2024-05-16 17:00:42

我的收藏
时序数据库 InfluxDB 版支持通过腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP)实时监控实例资源的监控指标数据,腾讯云可观测平台通过可视化图形、表格、大屏、多种方式统计监控数据,并支持设置告警规则,并且以消息推送的方式帮助您第一时间了解数据库服务的异常,及时调整数据库性能,保障业务稳定运行。

监控粒度

时序数据库 InfluxDB 版支持查看近30天的监控数据。不同的时间跨度,监控数据采集的时间粒度不同,其监控数据的保留时长也不同。具体信息,请参见下表。
时间跨度
时间粒度
监控数据保留时长
5分钟
1分钟
1分钟:15天。
5分钟、1小时:31天。
30分钟
1分钟与5分钟
1小时
3小时
1分钟、5分钟、1小时
12小时
2天
7天
30天

监控指标

时序数据库 InfluxDB 版从实例、节点及数据库三个维度进行监控统计,包含请求、时延、资源使用率等20+多项指标项,提供完全透明的监控服务。具体信息,如下表所示 实例监控

实例监控

实例监控指对整个数据库实例的请求、响应时间、资源消耗情况等进行监控和分析。通过实例监控,可以及时发现和解决数据库性能问题,提升数据库的可用性和性能。具体指标,请参见下表。
监控分组
监控指标中文名称
英文名称
指标含义
单位
请求监控
读平均时延
latency_read_avg_ms
描述读请求命令平均执行的时延。
ms
写平均时延
latency_write_avg_ms
描述写请求命令平均执行的时延。
ms
总请求数
total_requests_cnt
描述每秒所有请求命令执行次数。
总请求失败率
total_requests_fail_ratio
描述所有请求执行失败的数量与总请求数量的百分比,执行失败包含被数据库拒绝执行、超时的请求等。
%
总请求拒绝率
total_requests_rejected_ratio
描述所有请求被数据库拒绝的数量与总请求数的百分比。
%
读请求数
read_requests_cnt
描述每秒读请求命令执行次数
读请求失败率
read_requests_fail_ratio
描述读请求命令执行失败与读请求数的百分比,执行失败包含被数据库拒绝执行、超时的请求等。
%
读请求拒绝率
read_requests_rejected_ratio
描述读请求命令被数据库拒绝的数量与读请求数的百分比。
%
写入数据点
write_points_cnt
描述写入的数据点数量。
写请求数
write_requests_cnt
描述每秒写请求命令执行次数。
写请求失败率
write_requests_fail_ratio
描述写请求命令执行失败的百分比。
%
写请求拒绝率
write_requests_rejected_ratio
描述写请求命令被数据库拒绝执行的百分比。
%
资源监控
存储容量使用率
storage_util
存储使用量和购买规格的百分比。
%
存储使用量
storage_used_bytes
数据存储的实际使用量。
Bytes
平均内存使用率
mem_util
计算节点监控的内存使用率,取平均值。
%
平均 CPU 使用率
cpu_util
计算节点监控的 CPU 使用率,取平均值。
%

节点监控

节点监控指对数据库集群的存储节点 CPU 及内存资源消耗情况的监控分析。具体指标,请参见下表。
监控指标名称
英文名称
指标含义
单位
单节点 CPU 使用率
cpu_util
CPU 使用率
%
单节点内存使用率
mem_util
内存使用率
%

库监控

库监控指对数据库已经创建的库的统计
监控指标名称
英文名称
指标含义
单位
CQ 任务数
cq_jobs_cnt
描述总的 CQ 任务数。
Count
CQ 任务成功率
cq_jobs_succ_ratio
描述 CQ 任务数按时成功执行的百分比。
%
单库磁盘使用率
storage_used_bytes
单个数据库占用磁盘的百分比。
%

监控操作

操作场景
操作描述
操作指导
查看监控指标
查看各个性能指标的监控视图
配置告警
给每个性能指标配置告警阈值
创建 Dashboard
Dashboard 会自动将监控数据以精美的图表形式呈现在监控面板中,使监控数据更加直观。