Trino 监控指标

最近更新时间:2024-03-26 10:38:01

我的收藏

TRINO-概览

标题
指标名称
指标单位
指标含义
节点数量
Active
活跃节点数量
Total
总节点数量
Failed
失败节点数量
查询
RunningQueries
正在运行的查询总数
QueuedQueries
等待状态的查询总数
查询频度
FailedQueries
个/min
失败的查询总数
AbandonedQueries
个/min
放弃的查询总数
CanceledQueries
个/min
取消的查询总数
CompletedQueries
个/min
完成的查询总数
StartedQueries
个/min
已启动的查询总数
每分钟数据输入输出量
InputDataSizeOneMinute
GB/min
输入数据速率
OutputDataSizeOneMinute
GB/min
输出数据速率

TRINO-WORKER

标题
指标名称
指标单位
指标含义
GC 次数
YGC
Young GC 次数
FGC
Full GC 次数
GC 时间
FGCT
s
Full GC 消耗时间
GCT
s
垃圾回收时间消耗
YGCT
s
Young GC 消耗时间
内存区域占比
S0
%
Survivor 0区内存使用占比
E
%
Eden 区内存使用占比
CCS
%
Compressed class space 区内存使用占比
S1
%
Survivor 1区内存使用占比
O
%
Old 区内存使用占比
M
%
Metaspace 区内存使用占比
JVM 内存
MemNonHeapUsedM
MB
JVM 当前已经使用的 NonHeapMemory 的数量
MemNonHeapCommittedM
MB
JVM 当前已经提交的 NonHeapMemory 的数量
MemHeapUsedM
MB
JVM 当前已经使用的 HeapMemory 的数量
MemHeapCommittedM
MB
JVM 当前已经提交的 HeapMemory 的数量
MemHeapMaxM
MB
JVM 配置的 HeapMemory 的数量
MemHeapInitM
MB
JVM 初始 HeapMem 的数量
MemNonHeapInitM
MB
JVM 初始 NonHeapMem 的数量
堆内存使率
MemHeapUsedRate
%
JVM 当前已经使用的 HeapMemory 的数量所占 JVM 配置的 HeapMemory 的数量的百分比
数据输入输出速率
InputDataSize.OneMinute.Rate
GB/min
输入数据速率
OutputDataSize.OneMinute.Rate
GB/min
输出数据速率
工作线程数
PeakThreadCount
峰值线程数
ThreadCount
线程数量
DaemonThreadCount
后台线程数量
进程运行时长
Uptime
s
进程运行时长
文件描述符数
MaxFileDescriptorCount
最大文件描述符数
OpenFileDescriptorCount
已打开文件描述符数量
task 失败数
FailedTasksOneMinuteRate
count/min
Task 平均失败数量,一分钟维度
task 数据输入量
InputDataSizeOneMinuteRate
bytes/min
Task 平均输入数据量,一分钟维度
task 数据输入行数
InputPositionsOneMinuteRate
count/min
Task 平均输入数据行数,一分钟维度
task 数据输出量
OutputDataSizeOneMinuteRate
bytes/min
Task 平均输出数据量,一分钟维度
task 数据输出行数
OutputPositionsOneMinuteRate
count/min
Task 平均输出数据行数,一分钟维度
Task Notification Executor
ActiveCount
count
正在执行的任务通知数量
QueuedTaskCount
count
等待执行的任务通知数量
Task Executor Split
WaitingSplits
count
TaskExecutor 等待 Splits 的数量
TotalSplits
count
TaskExecutor总的Splits数量
RunningSplits
count
TaskExecutor 正在执行的 Splits 数量
BlockedSplits
count
TaskExecutor 阻塞的 Splits 数量
Task Executor Time
BlockedQuantaWallTimeOneMinuteAvg
μs
Quanta Blocked 完整时间
SplitQueuedTimeOneMinuteAvg
μs
Split 平均等待时间
SplitWallTimeOneMinuteAvg
μs
Split 完整耗时
UnblockedQuantaWallTimeOneMinuteAvg
μs
Quanta Unblocked 完整时间
Input Page Size
OneMinuteAvg
Bytes
一分钟维度平均输入 Page 大小
OneMinuteMax
Bytes
一分钟最大输入 Page 大小
OneMinuteCount
Bytes
每分钟输入 Page 大小
Memory Pool
Free
Bytes
当前可用的内存大小
Max
Bytes
内存池的最大容量
Reserved
Bytes
已经预留但尚未使用的内存大小
ReservedRevocable
Bytes
已经预留但可以被回收的内存大小

TRINO-Coordinator

标题
指标名称
指标单位
指标含义
GC 次数
YGC
Young GC 次数
FGC
Full GC 次数
GC 时间
FGCT
s
Full GC 消耗时间
GCT
s
垃圾回收时间消耗
YGCT
s
Young GC 消耗时间
内存区域占比
S0
%
Survivor 0区内存使用占比
E
%
Eden 区内存使用占比
CCS
%
Compressed class space 区内存使用占比
S1
%
Survivor 1区内存使用占比
O
%
Old 区内存使用占比
M
%
Metaspace 区内存使用占比
JVM 内存
MemNonHeapUsedM
MB
JVM 当前已经使用的 NonHeapMemory 的数量
MemNonHeapCommittedM
MB
JVM 当前已经提交的 NonHeapMemory 的数量
MemHeapUsedM
MB
JVM 当前已经使用的 HeapMemory 的数量
MemHeapCommittedM
MB
JVM 当前已经提交的 HeapMemory 的数量
MemHeapMaxM
MB
JVM 配置的 HeapMemory 的数量
MemHeapInitM
MB
JVM 初始 HeapMem 的数量
MemNonHeapInitM
MB
JVM 初始 NonHeapMem 的数量
堆内存使率
MemHeapUsedRate
%
JVM 当前已经使用的 HeapMemory 的数量所占 JVM 配置的 HeapMemory 的数量的百分比
工作线程数
PeakThreadCount
峰值线程数
ThreadCount
线程数量
DaemonThreadCount
后台线程数量
进程运行时长
Uptime
s
进程运行时长
进程启动时间
StartTime
s
进程启动时间
文件描述符数
MaxFileDescriptorCount
最大文件描述符数
OpenFileDescriptorCount
已打开文件描述符数量
Node Status
ActiveNodeCount
Count
Active 节点数
InactiveNodeCount
Count
Inactive 节点数
ShuttingDownNodeCount
Count
ShuttingDown 节点数
Cluster Memory
ClusterMemory
Bytes
集群内存
ClusterTotalMemoryReservation
Bytes
集群总预留内存
ClusterUserMemoryReservation
Bytes
集群 user 预留内存
Leaked Queries
NumberOfLeakedQueries
count
集群内存泄漏的查询总数
Queries Killed
QueriesKilledDueToOutOfMemory
count
oom killed 的 Query 总数
Tasks Killed
TasksKilledDueToOutOfMemory
count
oom killed 的 task 总数
Cluster cpu cores
TotalAvailableProcessors
Cores
集群可用的处理器核数
Assigned Queries
AssignedQueries
count
Assigned 查询数
Node Manager
BlockedNodes
count
集群 block 节点数
Nodes
count
集群节点数
Cluster Memory Pool
ReservedDistributed
bytes
集群预留 Distributed 内存
ReservedRevocableDistributed
bytes
集群预留 Revocable Distributed 内存
TotalDistributed
bytes
总 Distributed 内存
FreeDistributed
bytes
集群可用 Distributed 内存
Memory Pool
Free
Bytes
当前可用的内存大小
Max
Bytes
内存池的最大容量
Reserved
Bytes
已经预留但尚未使用的内存大小
ReservedRevocable
Bytes
已经预留但可以被回收的内存大小
Required Workers
RequiredWorkers
count
查询 Worker 的数量
Query Execution
ExecutorActiveCount
count
active 状态的 Query 数量
QueuedTaskCount
count
队列中等待执行的 task 数量
TaskCount
count
task 的数量
Queued Queries
QueuedQueries
count
队列中等待执行的查询总数
Running Queries
RunningQueries
count
正在执行的查询数
Abandoned Queries
AbandonedQueriesOneMinuteRate
count/min
平均每分钟中止的查询数
Canceled Queries
CanceledQueriesOneMinuteRate
count/min
平均每分钟取消的查询数量
Completed Queries
CompletedQueriesOneMinuteRate
count/min
平均每分钟完成的查询数
Consumed Cpu Time
ConsumedCpuTimeOneMinuteRate
Secs/min
平均每分钟查询处理的 CPU 时间
Consumed Input
ConsumedInputOneMinuteRate
Bytes/min
平均每分钟 Consumed Input 大小
Consumed Input Rows
ConsumedInputRowsOneMinuteRate
Rows/min
平均每分钟 Consumed Input 的行数
External Failures
ExternalFailuresOneMinuteRate
count/min
平均每分钟 External Failures 的数量
Failed Queries
FailedQueriesOneMinuteRate
count/min
平均每分钟 Failed Queries 的数量
Insufficient Resources Failures
InsufficientResourcesFailuresOneMinuteRate
count/min
平均每分钟 Insufficient Resources Failures 的数量
Internal Failures
InternalFailuresOneMinuteRate
count/min
平均每分钟 Internal Failures 数量
Started Queries
StartedQueriesOneMinuteRate
count/min
平均每分钟 Started Queries 数量
Submitted Queries
SubmittedQueriesOneMinuteRate
count/min
平均每分钟 Submitted Queries 数量
User Error Failures
UserErrorFailuresOneMinuteRate
count/min
平均每分钟 User Error Failures 的数量
Wall Input
WallInputRateOneMinuteAvg
count/min
平均每分钟 WallInput 大小
High Memory Split Source
HighMemorySplitSourceOneMinuteCount
count
平均每分钟 HighMemory Split 个数
Queued Queries-${groupName}
NumQueuedQueries
count
队列中等待执行的查询的数量
SubGroups-${groupName}
NumRunningQueries
count
资源组中正在执行的查询的数量
Cpu Usage-${groupName}
CpuUsageMs
ms
资源组使用的 cpu 时间
Memory Usage-${groupName}
MemoryUsageB
bytes
资源组使用的内存使用量
Running Queries-${groupName}
NumEligibleSubGroups
count
资源组中符合并行执行的条件子分组数量