云数据库 KeeWiDB 提供全方位的监控数据和自定义告警功能,监控指标包括负载监控、访问统计和网络流量等。监控数据通过部署在每台宿主机上的 Agent 进行定时采集,然后上报给数据中转节点,通过中转节点进行数据检查、汇总,然后批量上报给腾讯云可观测平台系统,腾讯云可观测平台提供数据展示、数据查询 API 以及自定义告警等功能。
监控粒度
云数据库 KeeWiDB 暂不支持监控粒度的自定义选择,监控自适应策略如下:
时间跨度 | 监控粒度 | 保留时长 |
0天-1天 | 5秒 | 1天 |
0天 - 2天 | 1分钟 | 2天 |
2天 - 7天 | 5分钟 | 7天 |
7天 - 30天 | 1小时 | 30天 |
支持监控的实例类型
云数据库 KeeWiDB 支持对实例进行网络、时延、请求、命令、资源等全方位的监控,并为每个实例提供独立的监控视图,辅助运维人员分析性能指标的变化趋势。
监控指标
实例监控
指标分类 | 指标中文名称 | 指标中英文名称 | 单位 | 指标解释 |
网络 | 连接数量 | connections | 个 | 客户端通过 TCP 协议连接到数据库的数量。 |
| 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数的百分比。 |
| 入流量 | in_flow | Mb/s | 内网入流量。 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量的百分比。 |
| 入流量限流触发 | in_flow_limit | 次 | 入流量触发限流的次数。 |
| 出流量 | out_flow | Mb/s | 内网出流量。 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量的百分比。 |
| 出流量限流触发 | out_flow_limit | 次 | 出流量触发限流的次数。 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 KeeWiDB Server 的执行时延平均值。 |
| 最大执行时延 | latency_max | ms | Proxy 到 KeeWiDB Server 最大时延。 |
| 读平均时延 | latency_read | ms | Proxy 到 KeeWiDB Server 的读命令平均执行时延,读命令分类。 |
| 写平均时延 | latency_write | ms | Proxy 到 KeeWiDB Server 的写命令平均执行时延,写命令分类。 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 KeeWiDB Server 的读写命令之外的命令平均执行时延。 |
| p99延迟 | latency_p99 | ms | Proxy 到 KeeWiDB Server 执行的命令99%延迟时长。 |
请求 | 总请求 | kee_commands | 次/秒 | 每秒所执行的请求次数。 |
| 读请求 | kee_cmd_read | 次/秒 | 每秒读请求的执行次数。 |
| 写请求 | kee_cmd_write | 次/秒 | 每秒写请求的执行次数。 |
| 其他请求 | kee_cmd_other | 次/秒 | 每秒读写命令之外的命令执行次数。 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 每秒请求命令大小超过32KB的执行次数。 |
| Key 请求数 | cmd_key_count | 个/秒 | 每秒命令访问的 Key 个数。 |
| Mget 请求数 | cmd_mget | 个/秒 | 每秒 Mget 命令执行个数。 |
响应 | 慢查询 | kee_cmd_slow | 次/秒/ | 每秒执行请求时延大于 slowlog-log-slower-than 配置的次数。slowlog-log-slower-than 为 KeeWiDB 慢查询的评定时间,超过此配置项,将会被当成慢操作记录在慢查询日志中,单位:微秒。 |
| 执行错误 | cmd_err | 次/秒/ | 每秒命令执行错误的次数。例如,命令不存在、参数错误等情况。 |
CPU | CPU 使用率 | kee_cpu_util | % | 平均 CPU 使用率。 |
| 节点最大 CPU 使用率 | kee_max_cpu_util | % | 实例中节点(分片或者副本)最大 CPU 使用率。 |
持久内存 | 缓存命中率 | kee_keyspace_hit_uti | % | Key 命中 \\ (Key 命中 + KeyMiss),该指标可以反应 Cache Miss 的情况。 |
| Key 总个数 | kee_keys | 个 | 实例中所存在的 Key 的总数。 |
| Key 过期数 | kee_expire_keys | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys。 |
存储 | 硬盘使用量 | kee_disk_used | MB | 硬盘使用量的统计。 |
| 硬盘使用率 | kee_disk_util | % | 硬盘使用量与硬盘总容量的占比。 |
| 节点最大硬盘使用率 | kee_max_disk_util | % | 实例中节点(分片或者副本)最大硬盘使用率。 |
| 硬盘带宽使用量 | kee_disk_bd | MB/s | 硬盘每秒所占用的带宽。 |
| 硬盘 IOPS 使用量 | kee_disk_iops | 次/秒 | 硬盘每秒输入输出的请求次数。 |
Proxy 监控
指标分类 | 指标中文名称 | 指标中英文名称 | 单位 | 指标解释 |
CPU | CPU 使用率 | kee_cpu_util | % | Proxy 节点 CPU 使用率的变化趋势。 |
请求 | 总请求 | kee_commands | 次/秒 | Proxy 节点每秒所执行的请求次数。 |
| 读请求 | kee_cmd_read | 次/秒 | Proxy 节点每秒读请求的执行次数。 |
| 写请求 | kee_cmd_write | 次/秒 | Proxy 节点每秒写请求的执行次数。 |
| 其他请求 | kee_cmd_other | 次/秒 | Proxy 节点每秒读写命令之外的命令执行次数。 |
| 大 Value 请求 | cmd_big_value | 次/秒 | 每秒请求命令大小超过32KB的执行次数。 |
| Key 请求数 | cmd_key_count | 个/秒 | Proxy 节点每秒命令访问的 Key 个数。 |
| Mget 请求数 | cmd_mget | 次/秒 | Proxy 节点每秒 Mget 命令执行的次数。 |
| 执行错误 | cmd_err | 次/秒/ | 每秒命令执行错误的次数。例如,命令不存在、参数错误等情况。 |
网络 | 连接数量 | connections | 个 | 客户端通过 TCP 协议连接到 Proxy 节点的数量。 |
| 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数的百分比。 |
| 入流量 | in_flow | Mb/s | 内网入流量。 |
| 入流量使用率 | in_bandwidth_util | % | 内网入流量实际使用和最大流量的百分比。 |
| 入流量限流触发 | in_flow_limit | 次 | 入流量触发限流的次数。 |
| 出流量 | out_flow | Mb/s | 内网出流量。 |
| 出流量使用率 | out_bandwidth_util | % | 内网出流量实际使用和最大流量的百分比。 |
| 出流量限流触发 | out_flow_limit | 次 | 出流量触发限流的次数。 |
时延 | 平均执行时延 | latency_avg | ms | Proxy 到 KeeWiDB Server 的执行时延平均值。 |
| 最大执行时延 | latency_max | ms | Proxy 到 KeeWiDB Server 最大时延。 |
| 读平均时延 | latency_read | ms | Proxy 到 KeeWiDB Server 的读命令平均执行时延,读命令分类。 |
| 写平均时延 | latency_write | ms | Proxy 到 KeeWiDB Server 的写命令平均执行时延,写命令分类。 |
| 其他命令平均时延 | latency_other | ms | Proxy 到 KeeWiDB Server 的读写命令之外的命令平均执行时延。 |
| p99延迟 | latency_p99 | ms | Proxy 到 KeeWiDB Server 执行的命令99%延迟时长。 |
KeeWiDB 监控
指标分类 | 指标中文名称 | 指标中英文名称 | 单位 | 指标解释 |
CPU | CPU 使用率 | kee_cpu_util | % | KeeWiDB 节点 CPU 使用率。 |
网络 | 连接数 | connections | 个 | 客户端通过 TCP 协议连接到数据库实例的数量。 |
| 连接使用率 | connections_util | % | 实际 TCP 连接数量和最大连接数的百分比。 |
请求 | 总请求 | kee_commands | 次/秒 | KeeWiDB 节点每秒所执行的请求次数。 |
| 读请求 | kee_cmd_read | 次/秒 | KeeWiDB 节点每秒读请求的执行次数。 |
| 写请求 | kee_cmd_write | 次/秒 | KeeWiDB 节点每秒写请求的执行次数。 |
| 其他请求 | kee_cmd_other | 次/秒 | KeeWiDB 节点每秒读写命令之外的命令执行次数。 |
响应 | 慢查询 | kee_cmd_slow | 次/秒/ | 每秒执行请求时延大于 slowlog-log-slower-than 配置的次数。slowlog-log-slower-than 为 KeeWiDB 慢查询的评定时间,超过此配置项,将会被当成慢操作记录在慢查询日志中,单位:微秒。 |
| 执行错误 | cmd_err | 次/秒/ | 每秒命令执行错误的次数。例如,命令不存在、参数错误等情况。 |
持久内存 | 缓存命中率 | kee_keyspace_hit_util | % | Key 命中 \\ (Key命中 + KeyMiss),该指标可以反应 Cache Miss 的情况。 |
| key 总个数 | kee_keys | 个 | 实例存储的总 Key 个数(一级 Key)。 |
| key 过期数 | kee_expire_keys | 个 | 时间窗内被淘汰的 Key 个数,对应 info 命令输出的 expired_keys。 |
存储 | 硬盘使用量 | kee_disk_used | MB | 硬盘使用量的统计。 |
| 硬盘使用率 | kee_disk_util | % | 硬盘使用量与硬盘总容量的占比。 |
| 硬盘 IOPS 使用量 | kee_disk_iops | 次/秒 | 硬盘每秒输入输出的请求次数。 |
| ||||
|