功能描述
性能趋势实时监控数据库实例、Redis 节点以及 Proxy 节点关键性能指标,包括:CPU、内存、Key 信息、网络使用量、网络使用率、请求、响应等,秒级监控数据采集粒度,以图形化方式动态展示各个指标的变化趋势,以表格形式统计各个指标的最大值、最小值及平均值,多节点指标对比查看、不同时间段指标对比分析,随意调大拖动监控视图。n其强大的数据统计分析能力,丰富多样的展示方式,极高的实时性,可满足数据库实例日常运维、异常定位的各种场景,帮助运维人员快速地掌握数据库性能状况的全貌,及时预防风险。
监控指标
当前支持的监控指标分为3个维度,包括:实例、Redis 节点、Proxy 节点。
实例维度
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
| 节点最大 CPU 使用率 | cpu_max_util | % | 实例中节点(分片或者副本)最大 CPU 使用率 |
内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
| 节点最大内存使用率 | mem_max_util | % | 实例中节点(分片或者副本)最大内存使用率 |
Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| 入流量 | in_flow | Mb/s | 内网入流量 |
| 出流量 | out_flow | Mb/s | 内网出流量 |
网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
请求 | 总请求 | commands | 次/秒 | QPS,命令执行次数 |
| 读请求 | cmd_read | 次/秒 | 每秒读命令执行次数 |
| 写请求 | cmd_write | 次/秒 | 每秒写命令执行次数 |
| 其他请求 | cmd_other | 次/秒 | 每秒读写命令之外的命令执行次数 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 每秒请求命令大小超过32KB的执行次数 |
| Key 请求数 | cmd_key_count | 次/秒 | 每秒请求 Key 数量 |
| Mget 请求数 | cmd_cmget | 次/秒 | 每秒通过 Mget 请求的数量 |
响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog - log - slower - than 配置的命令次数 |
| 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key 命中 + KeyMiss),该指标可以反应 Cache Miss 的情况,当访问为0时,该值为 null |
执行错误 | 执行错误 | cmd_err | 次 | 命令执行错误的次数,例如命令不存在、参数错误等情况 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| P99执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| 读平均时延 | latency_read | ms | Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类 |
| 写平均时延 | latency_write | ms | Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
Redis 节点
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
网络使用量 | 连接数 | connections | 个 | Proxy 连接到节点的连接数 |
| 连接使用率 | connections_util | % | 节点连接数使用率 |
内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
复制延迟 | 复制延迟 | repl_delay | Byte | 副本节点的相对主节点命令延迟长度 |
请求 | 总请求 | commands | 次/秒 | QPS,命令执行次数 |
| 读请求 | cmd_read | 次/秒 | 读命令执行次数,读命令分类,请参见 命令分类 |
| 写请求 | cmd_write | 次/秒 | 写命令执行次数,写命令分类,请参见 命令分类 |
| 其他请求 | cmd_other | 次/秒 | 读写命令之外的命令执行次数 |
响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog-log-slower-than 配置的命令次数 |
| 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key命中 + KeyMiss),该指标可以反应 Cache Miss 的情况 |
Proxy 节点
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | Proxy CPU 使用率 |
请求 | 总请求 | proxy_commands | 次/秒 | Proxy 执行的命令数 |
| Key 请求数 | cmd_key_count | 个/秒 | 命令访问的 Key 个数 |
| Mget 请求数 | cmd_mget | 次/秒 | Mget 命令执行次数 |
| 执行错误 | cmd_err | 次/秒 | Proxy 命令执行错误的次数,例如,命令不存在、参数错误等情况 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 请求命令大小超过32KB的执行次数 |
流量 | 入流量 | in_flow | Mb/s | 内网入流量 |
| 出流量 | out_flow | Mb/s | 内网出流量 |
网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| 每秒建连数 | client_connections_received_per_second | 个 | 每秒建立的 TCP 连接的数量 |
| 每秒断连数 | client_connections_closed_per_second | 个 | 每秒断开的 TCP 连接的数量 |
| 每秒异常断连数 | client_connections_aborted_per_second | 个 | 每秒异常断开的 TCP 连接的数量 |
网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| 入流量限流触发 | in_flow_limit | 次 | 入流量触发限流的次数 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
| 出流量限流触发 | out_flow_limit | 次 | 出流量触发限流的次数 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| P99执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| 读平均时延 | latency_read | ms | Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类 |
| 写平均时延 | latency_write | ms | Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
查看监控数据
步骤1:选择监控指标
1. 登录 Redis 控制台。
2. 在左侧导航栏,选择诊断优化。
3. 在数据库智能管家 DBbrain 的诊断优化页面上方,在实例 ID 的下拉列表选择需查看的实例。n

4. 单击性能趋势页签,在指标类别的下拉列表,勾选需分析的性能指标,并保存。n如果需要设置性能指标应用于该腾讯云账号下的所有云数据库 Redis 实例,可单击保存并应用于全部实例,如下图所示。n

步骤2:设置采集粒度
在性能趋势页签右上方自动刷新右侧的下拉列表中,选择监控数据采集粒度,支持5秒、15秒、30秒。请参见下图。n

步骤3:查看监控指标变化趋势
查看不同维度监控指标
在性能趋势页签指标类别下方,您可根据业务运维场景需求,查看实例、Redis 节点、Proxy 节点不同维度的监控指标数据。n

多节点性能指标对比
1. 在性能趋势页签,单击多节点性能对比。
2. 在多节点性能对比面板,单击新建多节点性能对比。
3. 在新建多节点性能对比对话框,在监控时间后面的选择框,单击
选择监控时间段,在监控项的下拉列表中,选择需对比的监控指标,然后单击确定。



4. 在多节点性能对比面板的任务列表中,等待状态为生成成功。n

5. 单击操作列的查看,查看该指标 Redis 全节点的监控对比数据。下图以连接数指标为例展示。n

切换实时/历史视图
在性能趋势页签,默认实时展示监控数据。
日常运维监控中,可实时监控数据库实例的各项指标。
异常定位时,单击历史,可分析历史上某一时间区间的监控数据。
支持直接查看近1小时、近3小时、近7天的监控数据,
单击
,选择查看近30天任意时间段的监控数据。n


不同时间段监控性能对比
1. 在性能趋势页签,单击历史,再单击添加时间对比。
2. 在时间选择框,选择需对比的两个时间段。
3. 选择需关注的监控指标,将鼠标放在监控视图变化趋势图上,对比两个时间段的监控数据。n

以图表形式统计监控指标数据
单击下图中的显示统计分析后面的
,以表格形式展示每一个监控指标最大值、最小值、平均值的统计数据。n


在任一监控视图的右上角,单击
,以表格形式展示该监控指标最大值、最小值、平均值的统计数据。n请参见下图,以网络使用量为例。n


通过图表联动查看监控数据
开启图表联动功能,适用于分析一个监控视图的数据同步分析与其相关联的监控视图。
1. 在性能趋势页签右上方,单击图表联动后面的
。

2. 在需分析的任一监控类别的监控视图上,选择时间点并单击,其他监控视图将固定显示相同时间的监控图表数据。
3. 单击监控视图右上角的撤销固定可取消固定。n

自定义监控指标对比分析
在任一监控视图右上角,单击
,可添加其他类型的监控指标项进行对比查看分析。n


切换监控视图单列/双列显示模式。
单击右上角的图标联动右侧的
,可切换单列模式和双列模式的显示。单列模式请参见下图。n


自由拖动监控视图位置
监控视图之间可以随意拖动,您可根据运维场景灵活调整监控视图的先后顺序,便于高效查看分析。
放大监控视图
拉动任一监控视图右下角的图标,可以任意拉伸放大图片,便于更加清晰地投放展示指标的变化趋势图。n
