有奖捉虫:云通信与企业服务文档专题,速来> HOT

功能描述

性能趋势实时监控数据库实例、Redis 节点以及 Proxy 节点关键性能指标,包括:CPU、内存、Key 信息、网络使用量、网络使用率、请求、响应等,秒级监控数据采集粒度,以图形化方式动态展示各个指标的变化趋势,以表格形式统计各个指标的最大值、最小值及平均值,多节点指标对比查看、不同时间段指标对比分析,随意调大拖动监控视图。 其强大的数据统计分析能力,丰富多样的展示方式,极高的实时性,可满足数据库实例日常运维、异常定位的各种场景,帮助运维人员快速地掌握数据库性能状况的全貌,及时预防风险。

监控指标

当前支持的监控指标分为3个维度,包括:实例、Redis 节点、Proxy 节点。

实例维度

指标类别
指标中文名
指标英文名
单位
指标含义
CPU
CPU 使用率
cpu_util
%
平均 CPU 使用率
节点最大 CPU 使用率
cpu_max_util
%
实例中节点(分片或者副本)最大 CPU 使用率
内存信息
内存使用量
mem_used
MB
实际使用内存容量,包含数据和缓存部分
内存使用率
mem_util
%
实际使用内存和申请总内存之比
节点最大内存使用率
mem_max_util
%
实例中节点(分片或者副本)最大内存使用率
Key 信息
Key 总个数
keys
实例存储的总 Key 个数(一级 Key)
Key 过期数
expired
时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys
Key 驱逐数
evicted
时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys
网络使用量
连接数
connections
连接到实例的 TCP 连接数量
入流量
in_flow
Mb/s
内网入流量
出流量
out_flow
Mb/s
内网出流量
网络使用率
连接使用率
connections_util
%
实际 TCP 连接数量和最大连接数比
入流量使用率
in_bandwidth_util
%
内网入流量实际使用和最大流量比
出流量使用率
out_bandwidth_util
%
内网出流量实际使用和最大流量比
请求
总请求
commands
次/秒
QPS,命令执行次数
读请求
cmd_read
次/秒
每秒读命令执行次数
写请求
cmd_write
次/秒
每秒写命令执行次数
其他请求
cmd_other
次/秒
每秒读写命令之外的命令执行次数
大 Value 请求
cmd_big_value
次/秒
每秒请求命令大小超过32KB的执行次数
Key 请求数
cmd_key_count
次/秒
每秒请求 Key 数量
Mget 请求数
cmd_cmget
次/秒
每秒通过 Mget 请求的数量
响应
慢查询
cmd_slow
执行时延大于 slowlog - log - slower - than 配置的命令次数
读请求命中
cmd_hits
读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标
读请求 Miss
cmd_miss
读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标
读请求命中率
cmd_hits_ratio
%
Key 命中 / (Key 命中 + KeyMiss),该指标可以反应 Cache Miss 的情况,当访问为0时,该值为 null
执行错误
执行错误
cmd_err
命令执行错误的次数,例如命令不存在、参数错误等情况
时延
平均执行时延
latency_avg
ms
Proxy 到 Redis Server 的执行时延平均值
最大执行时延
latency_max
ms
Proxy 到 Redis Server 的执行时延最大值
P99执行时延
latency_p99
ms
Proxy 到 Redis Server 99%的执行时延
读平均时延
latency_read
ms
Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类
写平均时延
latency_write
ms
Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类
其他命令平均时延
latency_other
ms
Proxy 到 Redis Server 的读写命令之外的命令平均执行时延

Redis 节点

指标类别
指标中文名
指标英文名
单位
指标含义
CPU
CPU 使用率
cpu_util
%
平均 CPU 使用率
网络使用量
连接数
connections
Proxy 连接到节点的连接数
连接使用率
connections_util
%
节点连接数使用率
内存信息
内存使用量
mem_used
MB
实际使用内存容量,包含数据和缓存部分
内存使用率
mem_util
%
实际使用内存和申请总内存之比
Key 信息
Key 总个数
keys
实例存储的总 Key 个数(一级 Key)
Key 过期数
expired
时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys
Key 驱逐数
evicted
时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys
复制延迟
复制延迟
repl_delay
Byte
副本节点的相对主节点命令延迟长度
请求
总请求
commands
次/秒
QPS,命令执行次数
读请求
cmd_read
次/秒
读命令执行次数,读命令分类,请参见 命令分类
写请求
cmd_write
次/秒
写命令执行次数,写命令分类,请参见 命令分类
其他请求
cmd_other
次/秒
读写命令之外的命令执行次数
响应
慢查询
cmd_slow
执行时延大于 slowlog-log-slower-than 配置的命令次数
读请求命中
cmd_hits
读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标
读请求 Miss
cmd_miss
读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标
读请求命中率
cmd_hits_ratio
%
Key 命中 / (Key命中 + KeyMiss),该指标可以反应 Cache Miss 的情况

Proxy 节点

指标类别
指标中文名
指标英文名
单位
指标含义
CPU
CPU 使用率
cpu_util
%
Proxy CPU 使用率
请求
总请求
proxy_commands
次/秒
Proxy 执行的命令数
Key 请求数
cmd_key_count
个/秒
命令访问的 Key 个数
Mget 请求数
cmd_mget
次/秒
Mget 命令执行次数
执行错误
cmd_err
次/秒
Proxy 命令执行错误的次数,例如,命令不存在、参数错误等情况
大 Value 请求
cmd_big_value
次/秒
请求命令大小超过32KB的执行次数
流量
入流量
in_flow
Mb/s
内网入流量
出流量
out_flow
Mb/s
内网出流量
网络使用量
连接数
connections
连接到实例的 TCP 连接数量
每秒建连数
client_connections_received_per_second
每秒建立的 TCP 连接的数量
每秒断连数
client_connections_closed_per_second
每秒断开的 TCP 连接的数量
每秒异常断连数
client_connections_aborted_per_second
每秒异常断开的 TCP 连接的数量
网络使用率
连接使用率
connections_util
%
实际 TCP 连接数量和最大连接数比
入流量使用率
in_bandwidth_util
%
内网入流量实际使用和最大流量比
入流量限流触发
in_flow_limit
入流量触发限流的次数
出流量使用率
out_bandwidth_util
%
内网出流量实际使用和最大流量比
出流量限流触发
out_flow_limit
出流量触发限流的次数
时延
平均执行时延
latency_avg
ms
Proxy 到 Redis Server 的执行时延平均值
最大执行时延
latency_max
ms
Proxy 到 Redis Server 的执行时延最大值
P99执行时延
latency_p99
ms
Proxy 到 Redis Server 99%的执行时延
读平均时延
latency_read
ms
Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类
写平均时延
latency_write
ms
Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类
其他命令平均时延
latency_other
ms
Proxy 到 Redis Server 的读写命令之外的命令平均执行时延

查看监控数据

步骤1:选择监控指标

1. 登录 Redis 控制台
2. 在左侧导航栏,选择诊断优化
3. 数据库智能管家 DBbrain诊断优化页面上方,在实例 ID 的下拉列表选择需查看的实例。


4. 单击性能趋势页签,在指标类别的下拉列表,勾选需分析的性能指标,并保存。 如果需要设置性能指标应用于该腾讯云账号下的所有云数据库 Redis 实例,可单击保存并应用于全部实例,如下图所示。



步骤2:设置采集粒度

性能趋势页签右上方自动刷新右侧的下拉列表中,选择监控数据采集粒度,支持5秒、15秒、30秒。请参见下图。



步骤3:查看监控指标变化趋势

查看不同维度监控指标

性能趋势页签指标类别下方,您可根据业务运维场景需求,查看实例、Redis 节点、Proxy 节点不同维度的监控指标数据。
img



多节点性能指标对比

1. 性能趋势页签,单击多节点性能对比
2. 多节点性能对比面板,单击新建多节点性能对比
3. 新建多节点性能对比对话框,在监控时间后面的选择框,单击

选择监控时间段,在监控项的下拉列表中,选择需对比的监控指标,然后单击确定



4. 多节点性能对比面板的任务列表中,等待状态生成成功


5. 单击操作列的查看,查看该指标 Redis 全节点的监控对比数据。下图以连接数指标为例展示。



切换实时/历史视图

性能趋势页签,默认实时展示监控数据。
日常运维监控中,可实时监控数据库实例的各项指标。
异常定位时,单击历史,可分析历史上某一时间区间的监控数据。
支持直接查看近1小时、近3小时、近7天的监控数据,
单击

,选择查看近30天任意时间段的监控数据。



不同时间段监控性能对比

1. 性能趋势页签,单击历史,再单击添加时间对比
2. 在时间选择框,选择需对比的两个时间段。
3. 选择需关注的监控指标,将鼠标放在监控视图变化趋势图上,对比两个时间段的监控数据。



以图表形式统计监控指标数据

单击下图中的显示统计分析后面的

,以表格形式展示每一个监控指标最大值、最小值、平均值的统计数据。


在任一监控视图的右上角,单击

,以表格形式展示该监控指标最大值、最小值、平均值的统计数据。 请参见下图,以网络使用量为例。



通过图表联动查看监控数据

开启图表联动功能,适用于分析一个监控视图的数据同步分析与其相关联的监控视图。
1. 性能趋势页签右上方,单击图表联动后面的

2. 在需分析的任一监控类别的监控视图上,选择时间点并单击,其他监控视图将固定显示相同时间的监控图表数据。
3. 单击监控视图右上角的撤销固定可取消固定。
img



自定义监控指标对比分析

在任一监控视图右上角,单击

,可添加其他类型的监控指标项进行对比查看分析。



切换监控视图单列/双列显示模式。

单击右上角的图表联动右侧的

,可切换单列模式和双列模式的显示。单列模式请参见下图。



自由拖动监控视图位置

监控视图之间可以随意拖动,您可根据运维场景灵活调整监控视图的先后顺序,便于高效查看分析。

放大监控视图

拉动任一监控视图右下角的图标,可以任意拉伸放大图片,便于更加清晰地投放展示指标的变化趋势图。