有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

命名空间

Namespace=QCE/CKAFKA

监控指标

消费分组—分区

指标英文名
指标中文名
指标说明
单位
维度
CpartitionConsumerSpeed
分区消费速度
消费分组在该分区的消费速率(条/分钟)
次/分钟
consumerGroup,instanceId,topicId,partition,topicName
CgroupMaxOffset
消费分组最大 offset
消费分组该分区当前消费 offset
consumerGroup,instanceId,topicId,partition,topicName
CtopicMsgOffset
主题级别消费分组 offset
主题级别消费分组 offset
consumerGroup,instanceId,topicId,partition,topicName
CtopicUnconsumeMsgCount
主题级别未消费消息个数
消费分组在该分区下未消费消息数
consumerGroup,instanceId,topicId,partition,topicName
CtopicUnconsumeMsgOffset
主题级别未消费消息堆积量
消费分组在该分区下未消费消息堆积量
MB
consumerGroup,instanceId,topicId,partition,topicName
CpartitionUnconsume
未消费的消息条数
分区当前未消费消息
count
consumerGroup,instanceId,topicId,partition,topicName
CpartitionOffset
当前消费 offset
分区当前消费 offset
count
consumerGroup,instanceId,topicId,partition,topicName
CpartitionMaxOffset
当前 partition 最大 offset
分区最大 offset
count
consumerGroup,instanceId,topicId,partition,topicName

消费分组—主题

指标英文名
指标中文名
指标说明
单位
维度
CtopicConsumerSpeed
主题消费速度
当前主题所有分区消费组消费速率总和
次/分钟
consumerGroup,instanceId,topicId,topicName
MaxOffsetTopic
消费分组对应当前 topic 最大 offset
当前主题中所有分区的最大 offset
consumerGroup,instanceId,topicId,topicName
OffsetTopic
消费分组当前消费 offset(区分 offset 最大值)
当前主题所有分区中消费组消费的最大 offset
consumerGroup,instanceId,topicId,topicName
UnconsumeSizeTopic
消费分组未消费消息大小
当前主题所有分区消费组未消费消息大小
MB
consumerGroup,instanceId,topicId,topicName
UnconsumeTopic
消费分组未消费消息数
当前主题所有分区消费组未消费消息总和
consumerGroup,instanceId,topicId,topicName

消费分组—信息

指标英文名
指标中文名
指标说明
单位
维度
PartitionProFlow
Topic 生产流量
Partition 生产流量(不包含副本产生的流量),按照所选择的时间粒度统计求和
MBytes
instanceid,partition,topicid
PartitionProCount
Topic 生产消息条数
Partition 生产消息条数,按照所选择的时间粒度统计求和
Count
instanceid,partition,topicid
PartitionMsgHeap
Topic 占用磁盘的消息总量
Partition 占用磁盘的消息总量(不包含副本),按照所选择的时间粒度取最新值
MBytes
instanceid,partition,topicid
PartitionMsgCount
Topic 落盘的消息总条数
Partition 落盘的消息总条数(不包含副本),按照所选择的时间粒度取最新值
Count
instanceid,partition,topicid
PartitionConFlow
Topic 消费流量
Partition 消费流量(不包含副本产生的流量),按照所选择的时间粒度统计求和
MBytes
instanceid,partition,topicid
PartitionConCount
Topic 消费消息条数
Partition 消费消息条数,按照所选择的时间粒度统计求和
Count
instanceid,partition,topicid

消息队列—同步任务集合

指标英文名
指标中文名
指标说明
单位
维度
SetSourceRecordActiveCount
此任务已生成但尚未完全写入 Kafka 的记录数(set 聚合)
未写入的目标的记录数
Count
setid
SetRecordsLead
已从源拉取的条数(set 聚合)
已从源拉取到的记录数
Count
setid
SetRecordSendTotal
当有消息正同步时,累计写入的记录数(set 聚合)
已写入目标的记录数
Count
setid
SetPollBatchMaxTimeMs
批次最大拉取耗时
批次拉取最大耗时
ms
setid
SetPollBatchAvgTimeMs
批次拉取的平均耗时
每批平均处理数据耗时
ms
setid
SetMaxLag
还未从源拉取到的条数(set 聚合)
未从源拉取到的记录数
Count
setid
SetBatchSizeMax
批次最大数据大小
批次最大处理数据记录数
Count
setid
SetBatchSizeAvg
批次平均数据大小
每批平均处理数据记录数
Count
setid

消息队列— 云服务实例监控

指标英文名
指标中文名
指标说明
单位
维度
Outtraffic
公网出带宽
公网出带宽
Bit/s
instanceid
Intraffic
公网入带宽
公网入带宽
Bit/s
instanceid
MemUsage
公网出带宽
内存利用率
%
instanceid
LanOuttraffic
内网出带宽
内网出带宽。按照所选择的时间粒度统计求和。
MBytes
instanceid
LanIntraffic
内网入带宽
内网入带宽。按照所选择的时间粒度统计求和。
MBytes
instanceid
DiskUsage
磁盘使用率
每台 CVM 上的硬盘实际使用情况。由于挂载 HDD/SSD 硬盘物理限制,且需要预留额外空间应对突发情况等原因,所有主机硬盘使用率之和与 CKafka 实例磁盘使用率不一定一致。
%
instanceid
CpuUsage
CPU使用率
CPU使用率
%
instanceid

消息队列—k2k 同步

指标英文名
指标中文名
指标说明
单位
维度
SourceRecordWriteTotal
自该任务上次重新启动以来从转换输出并为此任务写入 Kafka 的记录数
源数据已写入的条数
Count
connectorname,task
SourceRecordPollTotal
指定源连接器的任务生成/轮询(转换前)的记录总数
已拉取源数据的条数
Count
connectorname,task

消息队列—JVM

指标英文名
指标中文名
指标说明
单位
维度
LastYoungGcCount
last_young_gc_count
Broker Yong GC的次数
Count
brokerip
LastOldGcCount
last_old_gc_count
Broker Full GC的次数
Count
brokerip

消息队列—Broker

指标英文名
指标中文名
指标说明
单位
维度
QueueSize
队列深度
请求队列深度反映当前未处理的生产请求个数。如果该值过大可能是同一时间请求量过大,CPU 负载过高或者磁盘 IO 出现瓶颈
-
broker_ip
DetectStatus
broker 探测状态
broker 实例状态
-
broker_ip
BZookeeperDisConnectsCount
zk 断连次数
Broker 和 Zookeeper 之间的长连接断开重连的次数。网络波动、集群负载较高有可能会引起连接断开和重连,发生时会切换 leader 。
该值是一个累加值,Broker 启动后,断连一次加1,只有 broker 重启才会置0
-
broker_ip
BUnderAr
低于 AR 分片数
集群中存在的未同步的副本个数。当实例存在未同步副本,就表示集群的健康度可能有问题
-
broker_ip
BProduceTotalTime999thTime
999th 生产总耗时
表示生产请求的总耗时,由请求队列耗时、本地耗时、延时回包耗时等指标汇总而成。
注意:在每一个时间点,总耗时不会等于以下五个耗时的累加。原因是每个指标都是各自取平均得到的,故不累加相等
五个耗时:请求队列耗时、本地耗时、延时回包耗时、空闲时间耗时、其他耗时(网络建立连接、资源加载等)
ms
broker_ip
BProduceTotalTime95thTime
95th 生产总耗时
表示生产请求的总耗时,由请求队列耗时、本地耗时、延时回包耗时等指标汇总而成。
注意:在每一个时间点,总耗时不会等于以下五个耗时的累加。原因是每个指标都是各自取平均得到的,故不累加相等
五个耗时:请求队列耗时、本地耗时、延时回包耗时、空闲时间耗时、其他耗时(网络建立连接、资源加载等)
ms
broker_ip
BProduceThrottleTime999thTime
999th 生产延时回包的耗时
生产延迟回包耗时999th
ms
broker_ip
BProduceThrottleTime95thTime
95th 生产延时回包的耗时
生产延迟回包耗时95th
ms
broker_ip
BProduceResponseQueueTime999thTime
999th 生产回包队列等待耗时
生产响应回包队列耗时999th
ms
broker_ip
BProduceResponseQueueTime95thTime
95th 生产回包队列等待耗时
生产响应回包队列耗时95th
ms
broker_ip
BProduceRequestQueueTime999thTime
999th 生产请求队列等待耗时
生产请求队列耗时999th
ms
broker_ip
BProduceRequestQueueTime95thTime
95th 生产请求队列等待耗时
生产请求队列耗时95th
ms
broker_ip
BProduceRemoteTime999thTime
999th 生产 ack=all 等待同步耗时
生产远程耗时999th
ms
broker_ip
BProduceRemoteTime95thTime
95th 生产 ack=all 等待同步耗时
生产远程耗时95th
ms
broker_ip
BProduceLocalTime999thTime
999th 生产本地耗时
生产本地耗时999th
ms
broker_ip
BProduceLocalTime95thTime
95th 生产本地耗时
生产本地耗时95th
ms
broker_ip
BNetworkProcessorAvgIdlePercent
网络繁忙程度
用于衡量实例当前网络线程处理能力的指标,越接近1越空闲
%
broker_ip
BIsrShrink
ISR 缩小抖动次数
Kafka ISR 收缩次数,即当出现 broker 宕机,zookeeper 重连的情况,会出现 ISR 缩小的次数统计
Count
broker_ip
BIsrExpand
ISR 扩充次数
Kafka ISR 扩充次数,即存在未同步副本的情况下,当未同步副本追上 leader 数据,会重新加入 ISR,此时该次数就会加1
Count
broker_ip
BConsumeTotalTime999thTime
999th 消费总耗时
表示消费的总耗时,由请求队列耗时、本地耗时等指标汇总而成。
注意:在每一个时间点,总耗时不会等于以下五个耗时的累加。原因是每个指标都是各自取平均得到的,故不相等
五个耗时:请求队列耗时、本地耗时、延时回包耗时、空闲时间耗时、其他耗时(网络建立连接、资源加载等)
ms
broker_ip
BConsumeTotalTime95thTime
95th 消费总耗时
表示消费的总耗时,由请求队列耗时、本地耗时等指标汇总而成。
注意:在每一个时间点,总耗时不会等于以下五个耗时的累加。原因是每个指标都是各自取平均得到的,故不相等
五个耗时:请求队列耗时、本地耗时、延时回包耗时、空闲时间耗时、其他耗时(网络建立连接、资源加载等)
ms
broker_ip
BConsumeThrottleTime999thTime
999th 消费延时回包的耗时
消费延迟回包耗时999th

broker_ip
BConsumeThrottleTime95thTime
95th 消费延时回包的耗时
消费延迟回包耗时95th
ms
broker_ip
BConsumeResponseQueueTime999thTime
999th 消费回包队列等待耗时
消费响应队列耗时999th
ms
broker_ip
BConsumeResponseQueueTime95thTime
95th 消费回包队列等待耗时
消费响应队列耗时95th
ms
broker_ip
BConsumeRequestQueueTime999thTime
999th 消费请求队列等待耗时
消费请求队列耗时999th
ms
broker_ip
BConsumeRequestQueueTime95thTime
95th 消费请求队列等待耗时
消费请求队列耗时95th
ms
broker_ip
BConsumeRemoteTime999thTime
999th 消费 ack=all 等待同步耗时
消费远程耗时999th
ms
broker_ip
BConsumeRemoteTime95thTime
95th 消费 ack=all 等待同步耗时
消费远程耗时95th
ms
broker_ip
BConsumeLocalTime999thTime
999th 消费本地耗时
消费本地耗时999th
ms
broker_ip
BConsumeLocalTime95thTime
95th 消费本地耗时
消费本地耗时95th
ms
broker_ip
说明:
每个指标的统计粒度(Period)可取值不一定相同,可通过 DescribeBaseMetrics 接口获取每个指标支持的统计粒度。

各维度对应参数总览

参数名称
维度名称
维度解释
格式
Instances.N.Dimensions.0.Name
consumerGroup
消费分组的维度名称
输入 String 类型维度名称:consumerGroup
Instances.N.Dimensions.0.Value
consumerGroup
具体消费分组信息
输入用户需要查看的消费分组信息,例如:perf-consumer-8330
Instances.N.Dimensions.1.Name
instanceId
实例 ID 的维度名称
输入 String 类型维度名称:instanceId
Instances.N.Dimensions.1.Value
instanceId
具体的实例 ID
输入用户需要查看监控的实例 ID,例如:ckafka-test
Instances.N.Dimensions.2.Name
topicId
主题 ID 的维度名称
输入 String 类型维度名称:topicId
Instances.N.Dimensions.2.Value
topicId
具体的主题 ID
输入用户订阅主题 ID,例如:topic-test
Instances.N.Dimensions.3.Name
partition
partition 的维度名称
输入 String 类型维度名称:partition
Instances.N.Dimensions.3.Value
partition
具体 partition 信息
输入 topic 分区信息,例如:0
Instances.N.Dimensions.4.Name
topicName
主题的维度名称
输入 String 类型维度名称:topicName
Instances.N.Dimensions.4.Value
topicName
具体主题名称
输入用户消费主题的名称,例如:test
Instances.N.Dimensions.5.Name
broker_ip
主题 ID 的名称
输入 String 类型维度名称:brokerIp
Instances.N.Dimensions.5.Value
broker_ip
主题 ID
输入用户要擦看的主题ID:示例值:inter-topic-hwz9

入参说明

查询消息队列分组消费监控数据,入参取值如下: &Namespace=QCE/CKAFKA &Instances.N.Dimensions.0.Name=consumerGroup &Instances.N.Dimensions.0.Value=消费分组 &Instances.N.Dimensions.1.Name=instanceId &Instances.N.Dimensions.1.Value=实例 ID &Instances.N.Dimensions.2.Name=topicId &Instances.N.Dimensions.2.Value=主题 ID &Instances.N.Dimensions.3.Name=partition &Instances.N.Dimensions.3.Value=分区 &Instances.N.Dimensions.4.Name=topicName &Instances.N.Dimensions.4.Value=主题名称
&Instances.N.Dimensions.5.Name=broker_ip &Instances.N.Dimensions.5.Value=主题 ID