HBase 监控指标

最近更新时间:2024-03-26 10:38:01

我的收藏

HBASE-概览

标题
指标名称
指标单位
指标含义
集群处于 RIT Region 个数
ritCount
Region in transition 的个数
ritCountOverThreshold
Region in transition 时间超过阈值的 Region 个数
集群 RIT 时间
ritOldestAge
ms
Region in transition 的最老年龄
每个 RS 平均 REGION 数
averageLoad
每个 RegionServer 平均 Region 数
集群 RS 数量
numRegionServers
当前存活的 RegionServer 个数
numDeadRegionServers
当前 Dead 的 RegionServer 个数
HMaster 读写数据量
receivedBytes
bytes/s
集群接收数据量
sentBytes
bytes/s
集群发送数据量
集群接口总请求量
clusterRequests
个/s
集群总请求数量
集群 Assignment 管理器操作
Assign_num_ops
Assign region次数
BulkAssign_num_ops
Bulk assign region次数
集群负载均衡次数
BalancerCluster_num_ops
集群负载均衡次数

HBASE-HMaster

标题
指标名称
指标单位
指标含义
GC 次数
YGC
Young GC 次数
FGC
Full GC 次数
GC 时间
FGCT
s
Full GC 消耗时间
GCT
s
垃圾回收时间消耗
YGCT
s
Young GC 消耗时间
内存区域占比
S0
%
Survivor 0区内存使用占比
E
%
Eden 区内存使用占比
CCS
%
Compressed class space 区内存使用占比
S1
%
Survivor 1区内存使用占比
O
%
Old 区内存使用占比
M
%
Metaspace 区内存使用占比
JVM 日志数量
LogFatal
Fatal 日志数量
LogError
Error 日志数量
LogWarn
Warn 日志数量
LogInfo
Info 日志数量
JVM 内存
MemNonHeapUsedM
MB
进程使用的非堆内存大小
MemNonHeapCommittedM
MB
进程 commit 的非堆内存大小
MemHeapUsedM
MB
进程使用的堆内存大小
MemHeapCommittedM
MB
进程 commit 的堆内存大小
MemHeapMaxM
MB
进程最大的堆内存大小
MemMaxM
MB
进程最大内存大小
堆内存使率
MemHeapUsedRate
%
JVM 当前已经使用的 HeapMemory 的数量所占 JVM 配置的 HeapMemory 的数量的百分比
JVM 线程数量
ThreadsNew
处于 NEW 状态的线程数量
ThreadsRunnable
处于 RUNNABLE 状态的线程数量
ThreadsBlocked
处于 BLOCKED 状态的线程数量
ThreadsWaiting
处于 WAITING 状态的线程数量
ThreadsTimedWaiting
处于 TIMED WAITING 状态的线程数量
ThreadsTerminated
当前 TERMINATED 状态线程数量
RPC 连接数
numOpenConnections
RPC 连接数
RPC 异常次数
FailedSanityCheckException
FailedSanityCheckException 异常次数
NotServingRegionException
NotServingRegionException 异常次数
OutOfOrderScannerNextException
OutOfOrderScannerNextException 异常次数
RegionMovedException
RegionMovedException 异常次数
RegionTooBusyException
RegionTooBusyException 异常次数
UnknownScannerException
UnknownScannerException 异常次数
RPC 队列请求数
numCallsInPriorityQueue
通用队列 RPC 请求数
numCallsInReplicationQueue
复制队列 RPC 请求数
进程启动时间
masterActiveTime
s
Master 进程 Active 时间
masterStartTime
s
Master 进程启动时间

HBASE-RegionServer

标题
指标名称
指标单位
指标含义
GC 次数
YGC
Young GC 次数
FGC
Full GC 次数
GC 时间
FGCT
s
Full GC 消耗时间
GCT
s
垃圾回收时间消耗
YGCT
s
Young GC 消耗时间
内存区域占比
S0
%
Survivor 0区内存使用占比
E
%
Eden 区内存使用占比
CCS
%
Compressed class space 区内存使用占比
S1
%
Survivor 1区内存使用占比
O
%
Old 区内存使用占比
M
%
Metaspace 区内存使用占比
JVM 日志数量
LogFatal
Fatal 日志数量
LogError
Error 日志数量
LogWarn
Warn 日志数量
LogInfo
Info 日志数量
JVM 内存
MemNonHeapUsedM
MB
进程使用的非堆内存大小
MemNonHeapCommittedM
MB
进程 commit 的非堆内存大小
MemHeapUsedM
MB
进程使用的堆内存大小
MemHeapCommittedM
MB
进程 commit 的堆内存大小
MemHeapMaxM
MB
进程最大的堆内存大小
MemMaxM
MB
进程最大内存大小
堆内存使率
MemHeapUsedRate
%
JVM 当前已经使用的 HeapMemory 的数量所占 JVM 配置的 HeapMemory 的数量的百分比
JVM 线程数量
ThreadsNew
处于 NEW 状态的线程数量
ThreadsRunnable
处于 RUNNABLE 状态的线程数量
ThreadsBlocked
处于 BLOCKED 状态的线程数量
ThreadsWaiting
处于 WAITING 状态的线程数量
ThreadsTimedWaiting
处于 TIMED WAITING 状态的线程数量
ThreadsTerminated
当前 TERMINATED 状态线程数量
Region 个数
regionCount
Region 个数
Region 本地化
percentFilesLocal
%
Region 的 HFile 位于本地 HDFS data node的比例
Region 副本本地化
percentFilesLocalSecondaryRegions
%
Region 副本的 HFile 位于本地 HDFS data node的比例
RPC 认证次数
authenticationFailures
RPC 认证失败次数
authenticationSuccesses
RPC 认证成功次数
RPC 连接数
numOpenConnections
RPC 连接数
RPC 异常次数
FailedSanityCheckException
FailedSanityCheckException 异常次数
NotServingRegionException
NotServingRegionException 异常次数
OutOfOrderScannerNextException
OutOfOrderScannerNextException 异常次数
RegionMovedException
RegionMovedException 异常次数
RegionTooBusyException
RegionTooBusyException 异常次数
UnknownScannerException
UnknownScannerException 异常次数
RPC 句柄数
numActiveHandler
RPC 句柄数
numActiveWriteHandler
RPC 读句柄数
numActiveReadHandler
RPC 写句柄数
numActiveScanHandler
RPC 扫描句柄数
RPC 队列请求数
numCallsInPriorityQueue
优先队列 RPC 请求数
numCallsInReplicationQueue
复制队列 RPC 请求数
numCallsInPriorityQueue
通用队列 RPC 请求数
numCallsInWriteQueue
写调用队列调用 RPC 请求数
numCallsInReadQueue
读取调用队列中 RPC 请求数
numCallsInScanQueue
扫描调用队列中 RPC 请求数
WAL 文件数量
hlogFileCount
WAL 文件数量
WAL 文件大小
hlogFileSize
Byte
WAL 文件大小
Memstore 大小
memStoreSize
MB
Memstore 大小
Store 个数
storeCount
Store 个数
Storefile 个数
storeFileCount
Storefile 个数
Storefile 大小
storeFileSize
MB
Storefile 大小
写磁盘速率
flushedCellsSize
bytes/s
写磁盘速率
平均延时
Append_mean
ms
Append 请求平均延时
Replay_mean
ms
Replay 请求平均延时
Get_mean
ms
Get 请求平均延时
updatesBlockedTime
ms
Memstore 可 flush 前的更新阻塞时间
RS 写磁盘次数
FlushTime_num_ops
Memstore flush 写磁盘次数
操作队列请求数
splitQueueLength
Split 队列长度
compactionQueueLength
Compaction 队列长度
flushQueueLength
Region Flush 队列长度
Replay 操作次数
Replay_num_ops
Replay 操作次数
慢操作次数
slowAppendCount
Append 请求时间超过1s的数量
slowDeleteCount
Delete 请求时间超过1s的数量
slowGetCount
Get 请求时间超过1s的数量
slowIncrementCount
Increment 请求时间超过1s的数量
slowPutCount
Put 请求时间超过1s的数量
split 请求
splitRequestCount
split 请求数
splitSuccessCount
split 成功次数
缓存块数量
blockCacheCount
Block Cache 中的 Block 数量
blockCacheHitCount
Block Cache hit 请求数
blockCacheMissCount
Block Cache miss 请求数
读缓存命中率
blockCacheExpressHitPercent
%
读缓存命中率
缓存块内存占用大小
blockCacheSize
Byte
缓存块内存占用大小
索引大小
staticBloomSize
Byte
未压缩的静态 Bloom Filters 大小
staticIndexSize
Byte
未压缩的静态索引大小
storeFileIndexSize
Byte
磁盘上 storeFile 中的索引大小
读写流量
receivedBytes
bytes/s
读写流量
sentBytes
bytes/s
接收数据量
读写请求量
Total
个/s
总请求量,当有Scan请求时,该值会小于读写请求之和
Read
个/s
读请求量
Write
个/s
写请求量
Append_num_ops
个/s
Append 请求量
Mutate_num_ops
个/s
Mutate请求量
Delete_num_ops
个/s
Delete 请求量
Increment_num_ops
个/s
Increment请求量
Get_num_ops
个/s
Get 请求量
Put_num_ops
个/s
Put 请求量
ScanTime_num_ops
个/s
Scan 请求量
ScanSize_num_ops
个/s
Scan 请求量
mutation 个数
mutationsWithoutWALCount
mutation 个数
mutation 大小
mutationsWithoutWALSize
Byte
mutation 大小
进程启动时间
regionServerStartTime
s
进程启动时间
同步 Log
source.sizeOfLogQueue
同步 Log 长度
同步耗时
source.ageOfLastShippedOp
ms
同步耗时
请求量
ReadRequestCount
个/s
读请求量/s
WriteRequestCount
个/s
写请求量/s
请求量
Read
个/s
读请求量/s
Write
个/s
写请求量/s
Store大小
memstoreSize
Byte
memstore大小
storeFileSize
Byte
storeFile大小
表级别请求延迟
getTime_99th_percentile
ms
99%请求处理时延
scanTime_99th_percentile
ms
99%请求处理时延
putTime_99th_percentile
ms
99%请求处理时延
incrementTime_99th_percentile
ms
99%请求处理时延
appendTime_99th_percentile
ms
99%请求处理时延
deleteTime_99th_percentile
ms
99%请求处理时延
请求处理时延
99th_percentile
ms
99%请求处理时延
99.9th_percentile
ms
99.9%请求处理时延
请求排队时延
99th_percentile
ms
99%请求排队时延
99.9th_percentile
ms
99.9%请求排队时延
SCAN SIZE
max
bytes
最大 ScanSize
mean
bytes
平均 ScanSize
min
bytes
最小 ScanSize
SCAN TIME
max
s
最大 ScanTime
mean
s
平均 ScanTime
min
s
最小 ScanTime
Bulkload 延迟
99th_percentile
ms
Bulkload 延迟
999th_percentile
ms
Append 延迟
99th_percentile
ms
Append 延迟
999th_percentile
ms
Delete 延迟
99th_percentile
ms
Delete 延迟
999th_percentile
ms
MultiGet 延迟
99th_percentile
ms
MultiGet 延迟
999th_percentile
ms
Get 延迟
99th_percentile
ms
Get 延迟
999th_percentile
ms
PutBatch 延迟
99th_percentile
ms
PutBatch 延迟
999th_percentile
ms
Put 延迟
99th_percentile
ms
Put 延迟
999th_percentile
ms
Increment 延迟
99th_percentile
ms
Increment 延迟
999th_percentile
ms
Compacted Count 速率
MinorCompactedCells
个/s
平均每秒 minor compacted cells 数
MajorCompactedCells
个/s
平均每秒 major compacted cells 数
Compacted Size 速率
Minor
CompactedCells
bytes/s
平均每秒 minor compacted cells 大小
MajorCompactedCells
bytes/s
平均每秒 major compacted cells 大小
Region本地化
percentFilesLocal
%
Region HFile 位于本地 HDFS data node 的比例
平均延时
updatesBlockedTime
ms
Memstore 可 flush 前的更新阻塞时间
pauseThresholdExceeded
info
count
INFO 级别暂停警报计数
warn
count
WARN 级别暂停警报计数
非 GC 造成停顿操作数
ops
count
非 GC 造成停顿操作数
非 GC 造成停顿最大时长
max
ms
非 GC 造成停顿最大时长
GC 造成停顿操作数
ops
count
GC 造成停顿操作数
GC 造成停顿最大时长
max
ms
GC 造成停顿最大时长
L1缓存每秒命中数
l1HitCount
count/s
L1缓存每秒命中数
L1缓存每秒未命中数
l1MissCount
count/s
L1缓存每秒未命中数
L1缓存命中率
l1HitRatio
%
L1缓存命中率
L2缓存每秒命中数
l2HitCount
count/s
L2缓存每秒命中数
L2缓存每秒未命中数
l2MissCount
count/s
L2缓存每秒未命中数
L2缓存命中率
l2HitRatio
%
L2缓存命中率

HBASE-Thrift

标题
指标名称
指标单位
指标含义
GC 次数
YGC
Young GC 次数
FGC
Full GC 次数
GC 时间
FGCT
s
Full GC 消耗时间
GCT
s
垃圾回收时间消耗
YGCT
s
Young GC 消耗时间
内存区域占比
S0
%
Survivor 0区内存使用占比
E
%
Eden 区内存使用占比
CCS
%
Compressed class space 区内存使用占比
S1
%
Survivor 1区内存使用占比
O
%
Old 区内存使用占比
M
%
Metaspace 区内存使用占比
JVM 线程数量
ThreadsNew
处于 NEW 状态的线程数量
ThreadsRunnable
处于 RUNNABLE 状态的线程数量
ThreadsBlocked
处于 BLOCKED 状态的线程数量
ThreadsWaiting
处于 WAITING 状态的线程数量
ThreadsTimedWaiting
处于 TIMED WAITING 状态的线程数量
ThreadsTerminated
处于 Terminated 状态的线程数量
JVM 日志数量
LogFatal
FATAL 级别日志数量
LogError
ERROR 级别日志数量
LogWarn
WARN 级别日志数量
LogInfo
INFO 级别日志数量
JVM 内存
MemNonHeapUsedM
MB
进程使用的非堆内存大小
MemNonHeapCommittedM
MB
进程 commit 的非堆内存大小
MemHeapUsedM
MB
进程使用的堆内存大小
MemHeapCommittedM
MB
进程 commit 的堆内存大小
MemHeapMaxM
MB
进程最大的堆内存大小
MemMaxM
MB
进程最大内存大小
堆内存使用率
MemHeapUsedRate
%
堆内存使用占比
Thrift 请求队列平均等待耗时
mean
ms
Thrift 请求队列平均等待耗时
Thrift 请求队列等待长度
len
count
Thrift 请求队列等待长度
Thrift 累计请求量
ops
count
Thrift 累计请求量