功能描述
性能趋势实时监控数据库实例、Redis 节点以及 Proxy 节点关键性能指标,包括:CPU、内存、Key 信息、网络使用量、网络使用率、请求、响应等,秒级监控数据采集粒度,以图形化方式动态展示各个指标的变化趋势,以表格形式统计各个指标的最大值、最小值及平均值,多节点指标对比查看、不同时间段指标对比分析,随意调大拖动监控视图。
其强大的数据统计分析能力,丰富多样的展示方式,极高的实时性,可满足数据库实例日常运维、异常定位的各种场景,帮助运维人员快速地掌握数据库性能状况的全貌,及时预防风险。
监控指标
当前支持的监控指标分为3个维度,包括:实例、Redis 节点、Proxy 节点。
实例维度
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
| 节点最大 CPU 使用率 | cpu_max_util | % | 实例中节点(分片或者副本)最大 CPU 使用率 |
内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
| 节点最大内存使用率 | mem_max_util | % | 实例中节点(分片或者副本)最大内存使用率 |
Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| 入流量 | in_flow | Mb/s | 内网入流量 |
| 出流量 | out_flow | Mb/s | 内网出流量 |
网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
请求 | 总请求 | commands | 次/秒 | QPS,命令执行次数 |
| 读请求 | cmd_read | 次/秒 | 每秒读命令执行次数 |
| 写请求 | cmd_write | 次/秒 | 每秒写命令执行次数 |
| 其他请求 | cmd_other | 次/秒 | 每秒读写命令之外的命令执行次数 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 每秒请求命令大小超过32KB的执行次数 |
| Key 请求数 | cmd_key_count | 次/秒 | 每秒请求 Key 数量 |
| Mget 请求数 | cmd_cmget | 次/秒 | 每秒通过 Mget 请求的数量 |
响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog - log - slower - than 配置的命令次数 |
| 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key 命中 + KeyMiss),该指标可以反应 Cache Miss 的情况,当访问为0时,该值为 null |
执行错误 | 执行错误 | cmd_err | 次 | 命令执行错误的次数,例如命令不存在、参数错误等情况 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| P99执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| 读平均时延 | latency_read | ms | Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类 |
| 写平均时延 | latency_write | ms | Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
Redis 节点
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | 平均 CPU 使用率 |
网络使用量 | 连接数 | connections | 个 | Proxy 连接到节点的连接数 |
| 连接使用率 | connections_util | % | 节点连接数使用率 |
内存信息 | 内存使用量 | mem_used | MB | 实际使用内存容量,包含数据和缓存部分 |
| 内存使用率 | mem_util | % | 实际使用内存和申请总内存之比 |
Key 信息 | Key 总个数 | keys | 个 | 实例存储的总 Key 个数(一级 Key) |
| Key 过期数 | expired | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys |
| Key 驱逐数 | evicted | 个 | 时间窗内被驱逐的 Key 个数,对应 info 命令输出的 evicted_keys |
复制延迟 | 复制延迟 | repl_delay | Byte | 副本节点的相对主节点命令延迟长度 |
请求 | 总请求 | commands | 次/秒 | QPS,命令执行次数 |
| 读请求 | cmd_read | 次/秒 | 读命令执行次数,读命令分类,请参见 命令分类 |
| 写请求 | cmd_write | 次/秒 | 写命令执行次数,写命令分类,请参见 命令分类 |
| 其他请求 | cmd_other | 次/秒 | 读写命令之外的命令执行次数 |
响应 | 慢查询 | cmd_slow | 次 | 执行时延大于 slowlog-log-slower-than 配置的命令次数 |
| 读请求命中 | cmd_hits | 次 | 读请求 Key 存在的个数,对应 info 命令输出的 keyspace_hits 指标 |
| 读请求 Miss | cmd_miss | 次 | 读请求 Key 不存在的个数,对应 info 命令输出的 keyspace_misses 指标 |
| 读请求命中率 | cmd_hits_ratio | % | Key 命中 / (Key命中 + KeyMiss),该指标可以反应 Cache Miss 的情况 |
Proxy 节点
指标类别 | 指标中文名 | 指标英文名 | 单位 | 指标含义 |
CPU | CPU 使用率 | cpu_util | % | Proxy CPU 使用率 |
请求 | 总请求 | proxy_commands | 次/秒 | Proxy 执行的命令数 |
| Key 请求数 | cmd_key_count | 个/秒 | 命令访问的 Key 个数 |
| Mget 请求数 | cmd_mget | 次/秒 | Mget 命令执行次数 |
| 执行错误 | cmd_err | 次/秒 | Proxy 命令执行错误的次数,例如,命令不存在、参数错误等情况 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 请求命令大小超过32KB的执行次数 |
流量 | 入流量 | in_flow | Mb/s | 内网入流量 |
| 出流量 | out_flow | Mb/s | 内网出流量 |
网络使用量 | 连接数 | connections | 个 | 连接到实例的 TCP 连接数量 |
| 每秒建连数 | client_connections_received_per_second | 个 | 每秒建立的 TCP 连接的数量 |
| 每秒断连数 | client_connections_closed_per_second | 个 | 每秒断开的 TCP 连接的数量 |
| 每秒异常断连数 | client_connections_aborted_per_second | 个 | 每秒异常断开的 TCP 连接的数量 |
网络使用率 | 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数比 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量比 |
| 入流量限流触发 | in_flow_limit | 次 | 入流量触发限流的次数 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量比 |
| 出流量限流触发 | out_flow_limit | 次 | 出流量触发限流的次数 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 Redis Server 的执行时延平均值 |
| 最大执行时延 | latency_max | ms | Proxy 到 Redis Server 的执行时延最大值 |
| P99执行时延 | latency_p99 | ms | Proxy 到 Redis Server 99%的执行时延 |
| 读平均时延 | latency_read | ms | Proxy 到 Redis Server 的读命令平均执行时延,读命令分类,请参见 命令分类 |
| 写平均时延 | latency_write | ms | Proxy 到 Redis Server 的写命令平均执行时延,写命令分类,请参见 命令分类 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 Redis Server 的读写命令之外的命令平均执行时延 |
查看监控数据
步骤1:选择监控指标
1. 登录 Redis 控制台。
2. 在左侧导航栏,选择诊断优化。
3. 在数据库智能管家 DBbrain 的诊断优化页面上方,在实例 ID 的下拉列表选择需查看的实例。
![](https://qcloudimg.tencent-cloud.cn/image/document/29d6074b1a49e6304e1d7fe062d3352b.png)
4. 单击性能趋势页签,在指标类别的下拉列表,勾选需分析的性能指标,并保存。
如果需要设置性能指标应用于该腾讯云账号下的所有云数据库 Redis 实例,可单击保存并应用于全部实例,如下图所示。
![](https://qcloudimg.tencent-cloud.cn/image/document/30d90380be7f3f4000152bb44c301769.png)
步骤2:设置采集粒度
在性能趋势页签右上方自动刷新右侧的下拉列表中,选择监控数据采集粒度,支持5秒、15秒、30秒。请参见下图。
![](https://qcloudimg.tencent-cloud.cn/image/document/49c6a3725ed9ca64818c69dd211be4cc.png)
步骤3:查看监控指标变化趋势
查看不同维度监控指标
在性能趋势页签指标类别下方,您可根据业务运维场景需求,查看实例、Redis 节点、Proxy 节点不同维度的监控指标数据。
![](https://qcloudimg.tencent-cloud.cn/image/document/cd4924ea1a9d7885002b9651d6ce6e42.png)
多节点性能指标对比
1. 在性能趋势页签,单击多节点性能对比。
2. 在多节点性能对比面板,单击新建多节点性能对比。
3. 在新建多节点性能对比对话框,在监控时间后面的选择框,单击![](https://qcloudimg.tencent-cloud.cn/image/document/f9fbdec3baef062c84348c4d8f2a3dbe.png)
选择监控时间段,在监控项的下拉列表中,选择需对比的监控指标,然后单击确定。
![](https://qcloudimg.tencent-cloud.cn/image/document/f9fbdec3baef062c84348c4d8f2a3dbe.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/bf10d7a5acdb0020a19c8238a43133cf.png)
4. 在多节点性能对比面板的任务列表中,等待状态为生成成功。
![](https://qcloudimg.tencent-cloud.cn/image/document/0143f1e0182d6f8b8ab6c8e47e27ce66.png)
5. 单击操作列的查看,查看该指标 Redis 全节点的监控对比数据。下图以连接数指标为例展示。
![](https://qcloudimg.tencent-cloud.cn/image/document/e5b9669d331ddb7b0a6994090bb7908c.png)
切换实时/历史视图
在性能趋势页签,默认实时展示监控数据。
日常运维监控中,可实时监控数据库实例的各项指标。
异常定位时,单击历史,可分析历史上某一时间区间的监控数据。
支持直接查看近1小时、近3小时、近7天的监控数据,
单击![](https://qcloudimg.tencent-cloud.cn/image/document/55a519706da7a56ec683adc97cc93b05.png)
,选择查看近30天任意时间段的监控数据。
![](https://qcloudimg.tencent-cloud.cn/image/document/55a519706da7a56ec683adc97cc93b05.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/45181c82581c28c13306a4c8ec4a2899.png)
不同时间段监控性能对比
1. 在性能趋势页签,单击历史,再单击添加时间对比。
2. 在时间选择框,选择需对比的两个时间段。
3. 选择需关注的监控指标,将鼠标放在监控视图变化趋势图上,对比两个时间段的监控数据。
![](https://qcloudimg.tencent-cloud.cn/image/document/29185d1840b985cf657c0b116eadff77.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/29185d1840b985cf657c0b116eadff77.png)
以图表形式统计监控指标数据
单击下图中的显示统计分析后面的![](https://qcloudimg.tencent-cloud.cn/image/document/8212c43f785499794fd2b7ab2a3de62d.png)
,以表格形式展示每一个监控指标最大值、最小值、平均值的统计数据。
![](https://qcloudimg.tencent-cloud.cn/image/document/e9e9762a29526da01ba5ef5c0c751fa4.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/8212c43f785499794fd2b7ab2a3de62d.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/e9e9762a29526da01ba5ef5c0c751fa4.png)
在任一监控视图的右上角,单击![](https://qcloudimg.tencent-cloud.cn/image/document/c886d0d481ef228f22afaf6eec1046c0.png)
,以表格形式展示该监控指标最大值、最小值、平均值的统计数据。
请参见下图,以网络使用量为例。
![](https://qcloudimg.tencent-cloud.cn/image/document/c886d0d481ef228f22afaf6eec1046c0.png)
通过图表联动查看监控数据
开启图表联动功能,适用于分析一个监控视图的数据同步分析与其相关联的监控视图。
1. 在性能趋势页签右上方,单击图表联动后面的![](https://qcloudimg.tencent-cloud.cn/image/document/870ce7aacb552481293ea3ac75bf4a52.png)
。
![](https://qcloudimg.tencent-cloud.cn/image/document/870ce7aacb552481293ea3ac75bf4a52.png)
2. 在需分析的任一监控类别的监控视图上,选择时间点并单击,其他监控视图将固定显示相同时间的监控图表数据。
3. 单击监控视图右上角的撤销固定可取消固定。
![img](https://qcloudimg.tencent-cloud.cn/image/document/1197af407a6e2fdbe2f4811521d94293.png)
![img](https://qcloudimg.tencent-cloud.cn/image/document/1197af407a6e2fdbe2f4811521d94293.png)
自定义监控指标对比分析
在任一监控视图右上角,单击![](https://qcloudimg.tencent-cloud.cn/image/document/a4a92f2667e19ba990647da85cfe13c5.png)
,可添加其他类型的监控指标项进行对比查看分析。
![](https://qcloudimg.tencent-cloud.cn/image/document/1bf3dd20b02dd844237251248bf8651a.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/a4a92f2667e19ba990647da85cfe13c5.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/1bf3dd20b02dd844237251248bf8651a.png)
切换监控视图单列/双列显示模式。
单击右上角的图表联动右侧的![](https://qcloudimg.tencent-cloud.cn/image/document/d08cd1869207c9141dfdae44157b5761.png)
,可切换单列模式和双列模式的显示。单列模式请参见下图。
![](https://qcloudimg.tencent-cloud.cn/image/document/90a37d032e7a73122d346c1e6d57d4ad.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/d08cd1869207c9141dfdae44157b5761.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/90a37d032e7a73122d346c1e6d57d4ad.png)
自由拖动监控视图位置
监控视图之间可以随意拖动,您可根据运维场景灵活调整监控视图的先后顺序,便于高效查看分析。
放大监控视图
拉动任一监控视图右下角的图标,可以任意拉伸放大图片,便于更加清晰地投放展示指标的变化趋势图。
![](https://qcloudimg.tencent-cloud.cn/image/document/c7cd8a427a4d373ee6f6e66a2d64ab89.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/c7cd8a427a4d373ee6f6e66a2d64ab89.png)