告警维度和告警指标说明

最近更新时间:2025-09-19 09:42:02

我的收藏
本文介绍应用性能监控所支持的告警维度和告警指标。
目前,应用性能监控支持基础性能指标运行时指标数据库调用指标错误调用指标4种策略类型,每种策略类型支持不同的告警维度和告警指标。

基础性能指标

告警维度

维度名称
补充说明
是否为必选告警对象维度
业务系统
业务系统用于分类管理应用,不同业务系统之间的监控数据完全隔离。
应用
应用是一个逻辑组合,多个使用相同应用名接入的进程,会表现为相同应用下的多个实例。
实例
实例是应用在物理或虚拟环境中的一个实际部署单元,通常对应一个进程。
调用角色
调用角色等同于 Span 类型,表示这条 Span 在链路中被哪一种身份记录,包括 ServerClientConsumerProducerInternal 5个枚举值,分别代表服务端、客户端、消费者、生产者,以及内部调用。
接口
接口等同于 Span 名称。
K8s 集群 ID
对应k8s.cluster.id实例属性,详情请参考 自定义应用实例属性
K8s Deployment
对应k8s.deployment.name实例属性,详情请参考 自定义应用实例属性
K8s 命名空间
对应k8s.namespace.name实例属性,详情请参考 自定义应用实例属性
服务版本
对应service.version实例属性,详情请参考 自定义应用实例属性
对端服务
用于标识该调用的对端服务。例如,当一个 Span 的调用角色为 Server 的时候,通常会对应另一个调用角色为 Client 的 Span,那个 Span 所在的应用,就是对端服务 。如果使用腾讯云增强版 Java 探针接入,APM 会在 Span 中自动注入对端服务。如果使用其他 OpenTelemetry 方案接入,APM 也会根据调用关系尽可能的在 Span 中注入对端服务。如果对端服务未能自动注入,您可以在上报到 APM 的 Span 中通过 peer.service 属性手动指定对端服务。
调用状态
表示该调用是否正确。包括正确错误未设置3个枚举值。
错误类型(下线中)
不推荐使用,仅适用于历史遗留的告警策略。

告警指标

指标名称
补充说明
单位
调用次数
统计时间段内的总调用次数。
每秒调用次数
平均每秒调用次数。
错误数
状态为错误的调用次数。
错误率
错误数 / 调用次数。
%
平均响应时间
响应时间的平均值。
毫秒
最大响应时间
响应时间的最大值。
毫秒
慢调用数量
响应时间大于2秒的调用为慢调用。
可容忍调用数量
响应时间大于等于0.5秒,且小于等于2秒的调用为可容忍调用。
Apdex
Apdex 标准从用户的角度出发,对应用响应时间的表现,转为可量化范围为0 - 1的满意度评价。
计算公式为((调用次数 - 可容忍调用数量 - 慢调用数量) + 可容忍调用数量 × 0.5) ÷ 调用次数
-

运行时指标

告警维度

维度名称
补充说明
是否为必选告警对象维度
业务系统
业务系统用于分类管理应用,不同业务系统之间的监控数据完全隔离。
应用
应用是一个逻辑组合,多个使用相同应用名接入的进程,会表现为相同应用下的多个实例。
实例
实例是应用在物理或虚拟环境中的一个实际部署单元,通常对应一个进程。
K8s 集群 ID
对应k8s.cluster.id实例属性,详情请参考 自定义应用实例属性
K8s Deployment
对应k8s.deployment.name实例属性,详情请参考 自定义应用实例属性
K8s 命名空间
对应k8s.namespace.name实例属性,详情请参考 自定义应用实例属性
服务版本
对应service.version实例属性,详情请参考 自定义应用实例属性
池种类
包括threadconnection2个枚举值,分别代表线程池和连接池。
组件类型
适用于连接池和线程池相关的指标。例如 tomcat
池名称
适用于连接池和线程池相关的指标。例如 http-nio-8080-exec-*
GC 类型
包括 Full GCYoung GCZGC 三种枚举类型。
收集器名称
适用于和 GC 相关的指标,例如 MarkSweepCompact
内存种类
适用于和内存利用率相关的指标。例如 Heap
内存区域
适用于和内存利用率相关的指标。例如 Eden

告警指标

指标名称
补充说明
单位
GC 次数
统计时间段内的 GC 总次数。
平均 GC 耗时
GC 耗时的平均值。
毫秒
CPU 利用率
对于 Java 应用,CPU 利用率取自 OperatingSystemMXBean。
%
堆内存使用率
堆内存使用率 = 已使用堆内存 / JVM 能从操作系统申请的最大堆内存。
%
内存空间使用量
JVM 某个内存区域已使用的内存。
MB
活跃线程数
JVM 进程中的活跃线程数。
线程池-活跃线程数
线程池中的活跃线程数。
线程池使用率
活跃线程数 / 最大线程数。
%
连接池-活跃连接数
连接池中的活跃连接数。
连接池使用率
活跃连接数 / 最大连接数。
%
Full GC 次数(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:GC次数,维度:GC类型=Full GC)。
平均 Full GC 耗时(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:平均GC耗时,维度:GC类型=Full GC)。
毫秒
堆内存使用量(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:内存空间使用量,维度:内存种类=Heap)。
MB
年轻代 Eden 区使用量(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:内存空间使用量,维度:内存种类=Heap内存区域=Eden)。
MB
年轻代 Survivor 区使用量(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:内存空间使用量,维度:内存种类=Heap内存区域=Survivor)。
MB
老年代使用量(下线中)
不推荐使用,仅适用于历史遗留的告警策略。
推荐使用(指标:内存空间使用量,维度:内存种类=Heap内存区域=Oldgen)。
MB

数据库调用指标

告警维度

维度名称
补充说明
是否为必选告警对象维度
业务系统
业务系统用于分类管理应用,不同业务系统之间的监控数据完全隔离。
应用
应用是一个逻辑组合,多个使用相同应用名接入的进程,会表现为相同应用下的多个实例。
实例
实例是应用在物理或虚拟环境中的一个实际部署单元,通常对应一个进程。
调用角色
调用角色等同于 Span 类型,表示这条 Span 在链路中被哪一种身份记录,包括 ServerClientConsumerProducerInternal 5个枚举值,分别代表服务端、客户端、消费者、生产者,以及内部调用。
服务版本
对应 service.version 实例属性,详情请参考 自定义应用实例属性
数据库类型
例如 mysqlredis 等。
数据库名称
具体数据库实例或逻辑数据库名称。

告警指标

指标名称
补充说明
单位
调用次数
统计时间段内的总调用次数。
平均响应时间
响应时间的平均值。
毫秒
慢 SQL 次数
响应时间大于2秒的调用为慢 SQL 调用。
错误次数
状态为错误的调用次数。
错误率
错误数 / 调用次数。
%

错误调用指标

告警维度

维度名称
补充说明
是否为必选告警对象维度
业务系统
业务系统用于分类管理应用,不同业务系统之间的监控数据完全隔离。
应用
应用是一个逻辑组合,多个使用相同应用名接入的进程,会表现为相同应用下的多个实例。
实例
实例是应用在物理或虚拟环境中的一个实际部署单元,通常对应一个进程。
调用角色
调用角色等同于 Span 类型,表示这条 Span 在链路中被哪一种身份记录,包括 ServerClientConsumerProducerInternal 5个枚举值,分别代表服务端、客户端、消费者、生产者,以及内部调用。
接口
接口等同于 Span 名称。
K8s 集群 ID
对应 k8s.cluster.id 实例属性,详情请参考 自定义应用实例属性
K8s Deployment
对应 k8s.deployment.name 实例属性,详情请参考 自定义应用实例属性
K8s 命名空间
对应 k8s.namespace.name 实例属性,详情请参考 自定义应用实例属性
服务版本
对应 service.version 实例属性,详情请参考 自定义应用实例属性
对端服务
用于标识该调用的对端服务。例如,当一个 Span 的调用角色为 Server 的时候,通常会对应另一个调用角色为 Client 的 Span,那个 Span 所在的应用,就是对端服务 。如果使用腾讯云增强版 Java 探针接入,APM 会在 Span 中自动注入对端服务。如果使用其他 OpenTelemetry 方案接入,APM 也会根据调用关系尽可能的在 Span 中注入对端服务。如果对端服务未能自动注入,您可以在上报到 APM 的 Span 中通过peer.service属性手动指定对端服务。
错误状态码
链路中具体的错误类型,例如 io.grpc.StatusRuntimeException

告警指标

指标名称
补充说明
单位
错误数
统计时间段内的错误调用总次数。