腾讯云可观测平台接入 LLM 应用

大语言模型近年来呈现出快速增长的趋势，随着 DeepSeek 的强势出圈，AI 应用的门槛进一步降低，为各行业引入高效且低成本的解决方案，推动了人工智能落地应用的爆炸式发展。
大语言模型应用的运行涉及多个组件和复杂的交互过程，应用性能监控 APM 通过分布式追踪技术，清晰地展示请求在各个组件之间的调用链路，一旦出现故障，可以快速定位到问题所在的具体环节。同时，APM 可以实时监测模型应用的运行状态，及时发现异常行为并发出告警，使运维人员及时采取措施，避免问题扩大化。
支持的 LLM 组件与框架
腾讯云自研 Python 探针同时支持对常见 LLM 框架和传统（非 LLM）Python 框架的自动埋点，兼容 OpenTelemetry 协议标准，能够和其他使用 OpenTelemetry 方案接入的应用实现链路信息互通，支持以下组件或框架。
说明：
要求 Python 3.9及以上版本。
支持的组件与框架
链接
LLM 组件与框架
﻿OpenAI SDK（openai >= 0.27.0）：OpenAI 官方提供的 API 封装，用于直接调用所有兼容 OpenAI 标准的大模型。
﻿Ollama（ollama >= 0.4.0）：本地运行和管理开源大模型的轻量化推理框架。
﻿LangChain / LangGraph（langchain-core > 0.1.0）：用于构建和编排大模型应用的工作流框架，支持复杂链路与状态管理。
﻿LlamaIndex（llama-index >= 0.7.0，llama-index-core >= 0.7.0）：专注于把外部数据接入 LLM 的 RAG 框架，提供检索与索引能力。
传统 Python 组件与框架
完整的 支持列表。
接入流程
注意：
如果服务部署在 TKE 集群中，同时集群安装了腾讯云 APM 的 operator，需要手动在工作负载中加入环境变量 OTEL_EXPORTER_METRICS_TEMPORALITY_PREFERENCE，值为 true。
获取接入点与 token
1. 登录 腾讯云可观测平台 控制台。
2. 在左侧菜单栏中选择应用性能监控，单击应用列表 > 接入应用。
3. 在右侧弹出的数据接入抽屉框中，单击 Python 语言。
4. 在接入 Python 应用页面，选择您所要接入的地域以及业务系统。
5. 选择接入协议类型为 OpenTelemetry。
6. 上报方式选择您所想要的上报方式，获取您的接入点和 Token。
说明：
内网上报：使用此上报方式，您的服务需运行在腾讯云 VPC。通过 VPC 直接联通，在避免外网通信的安全风险同时，可以节省上报流量开销。
外网上报：当您的服务部署在本地或非腾讯云 VPC 内，可以通过此方式上报数据。请注意外网通信存在安全风险，同时也会造成一定上报流量费用。
安装 pip 包
通过pip命令安装腾讯云自研探针，其中包含 OpenTelemetry-SDK 的相关依赖。
pip install tapm-distro opentelemetry-exporter-otlp==1.34.1
﻿
tapm-bootstrap -a install
命令行方式上报
加上 tapm-instrument 前缀完成埋点和启动，假设原来的项目启动命令是python app.py，现在可以通过如下命令启动 Python 应用。
tapm-instrument --traces_exporter otlp \\ 
--metrics_exporter otlp \\ 
--logs_exporter none \\ 
--service_name <service_name> \\ 
--resource_attributes "token=<token>,host.name=<host.name>" \\ 
--exporter_otlp_endpoint <endpoint> \\ 
python app.py
对应的字段说明如下，请根据实际情况进行替换。
<service_name> ：应用名，多个使用相同 serviceName 接入的应用进程，在 APM 中会表现为相同应用下的多个实例。应用名最长63个字符，只能包含小写字母、数字及分隔符“ - ”，且必须以小写字母开头，数字或小写字母结尾。
<token> ：前置步骤中拿到业务系统 Token。
<host.name>：该实例的主机名，是应用实例的唯一标识，通常情况下可以设置为应用实例的 IP 地址。
<endpoint> ：前置步骤中拿到的接入点。
接入验证
完成接入工作后，启动 LLM 应用，应用就会向 APM 上报链路数据。在 应用性能监控 > LLM 可观测 > 应用列表 页面将展示接入的应用。由于可观测数据的处理存在一定延时，如果接入后在控制台没有查询到应用或实例，请等待30秒左右。
同时，在 应用性能监控 > 链路追踪 中，也能够查询到相关的 Span 记录，通过单击第一列 traceID 对应的链接，可以进入链路详情视图分析链路的每个环节。
﻿
单击其中的 Span，能够获取更多详细信息，例如下图：
﻿

支持的组件与框架	链接
LLM 组件与框架	OpenAI SDK（openai >= 0.27.0）：OpenAI 官方提供的 API 封装，用于直接调用所有兼容 OpenAI 标准的大模型。 Ollama（ollama >= 0.4.0）：本地运行和管理开源大模型的轻量化推理框架。 LangChain / LangGraph（langchain-core > 0.1.0）：用于构建和编排大模型应用的工作流框架，支持复杂链路与状态管理。 LlamaIndex（llama-index >= 0.7.0，llama-index-core >= 0.7.0）：专注于把外部数据接入 LLM 的 RAG 框架，提供检索与索引能力。
传统 Python 组件与框架	完整的支持列表。

接入 LLM 应用

本页目录：

支持的 LLM 组件与框架

接入流程

获取接入点与 token

安装 pip 包

命令行方式上报

接入验证