全链路监控

最近更新时间:2024-07-01 10:07:21

我的收藏
全链路监控可通过 trace_id 将用户请求从客户端各个阶段到服务端各个服务节点之间的调用关系记录下来,形成一个完整的请求链路,帮助开发者和运维人员快速定位关键请求的性能瓶颈,提高系统的故障排除效率。

前提条件

已在终端性能监控 APP 服务中完成 应用接入
已在应用性能监控 APM 服务中完成 应用接入
注意:
目前仅支持通过 OpenTelemetry/SkyWalking 协议接入 APM 的应用实例与 APP 的应用实例进行全链路打通。应用语言无限制,请根据业务服务应用实际使用的语言完成 APM 接入。
为了确保验证数据的上报不受网络模块默认采样(0.1%)的影响,可在 终端性能监控 > 应用管理 > 白名单管理 中,为测试设备配置白名单,白名单中的设备采集到的性能数据将会全量上报,配置步骤请参见 应用管理 - 白名单配置

接入步骤

步骤1:在终端性能监控 SDK 中开启网络监控功能

步骤2:在终端性能监控 SDK 中开启全链路监控功能

步骤3:获取应用性能监控业务系统ID参数

1. 登录 应用性能监控
2. 侧边栏点击资源管理 > 资源总览
3. 
选择您需要和终端性能监控关联的业务系统并复制其业务系统 ID




步骤4:完成客户端与服务端实例关联

1. 侧边栏切换到终端性能监控,点击应用管理 > 应用设置



2. 选择您需要和应用性能监控关联的终端应用并点击编辑操作,将步骤3.3中获取的 APM 业务系统 ID 填入,完成配置修改即可实现实例关联。




步骤5:(可选)严格服务端安全策略下的放行

为了实现全链路 trace 的关联,根据您使用的协议(OpenTelemetry/SkyWalking),我们会在您的客户端请求服务端的 header 里面添加 transparent/sw8 字段。若您的服务端采用严格字段协议校验等安全策略,我们添加的字段可能会导致客户端请求服务端失败,我们主张您在开展全链路打通验证前与服务端同事针对该场景进行沟通,确保服务端对这些添加了 transparent/sw8 字段的请求进行放行。

步骤6:全链路打通验证

1. 上报慢请求/异常请求测试数据。
2. 侧边栏点击网络,在慢请求问题列表异常请求问题列表页签中可查看问题信息。



3. 点击新上报的问题列表行下钻问题详情,在上下文模块可查看到 trace_id。



4. 点击跳转下钻到 APM 产品的链路追踪详情中,则全链路打通验证成功。