本文将通过相关操作介绍如何通过腾讯云 OpenTelemetry-Python 探针接入 Python vLLM 应用,实现推理引擎全链路观测。
前提条件
该方案支持 Python 3.9及以上版本。
该方案支持 vLLM V1 引擎,从 vLLM v0.8.0 开始,vLLM 默认使用 V1 引擎。
已拥有腾讯云账号,且已开通 应用性能监控(APM)。
接入流程
获取接入点与 Token
1. 登录 腾讯云可观测平台 控制台。
2. 在左侧菜单栏中选择 LLM 可观测,单击应用列表 > 接入应用。
3. 选择您所要接入的地域以及业务系统。
4. 选择您想要的上报方式,获取您的接入点和 Token。
说明:
内网上报:使用此上报方式,您的服务需运行在腾讯云 VPC。通过 VPC 直接连通,在避免外网通信的安全风险的同时,可以节省上报流量开销。
外网上报:当您的服务部署在本地或非腾讯云 VPC 内,可以通过此方式上报数据。请注意外网通信存在安全风险,同时也会造成一定上报流量费用。
安装 pip 包
通过
pip命令安装腾讯云自研探针,其中包含 OpenTelemetry-SDK 的相关依赖。pip install tapm-distro opentelemetry-exporter-otlp==1.34.1tapm-bootstrap -a install
命令行方式上报
加上 tapm-instrument 前缀完成埋点和启动,假设原来的项目启动命令是
python app.py,现在可以通过如下命令启动 Python 应用。tapm-instrument --traces_exporter otlp \\--metrics_exporter otlp \\--logs_exporter none \\--service_name<service_name>\\--resource_attributes "token=<token>,host.name=<host.name>" \\--exporter_otlp_endpoint <endpoint> \\python app.py
对应的字段说明如下,请根据实际情况进行替换。
<service_name> :应用名,多个使用相同 serviceName 接入的应用进程,会表现为相同应用下的多个实例。应用名最长63个字符,只能包含小写字母、数字及分隔符“ - ”,且必须以小写字母开头,数字或小写字母结尾。<token> :获取接入点与 Token 中拿到的业务系统 Token。<host.name>:该实例的主机名,是应用实例的唯一标识,通常情况下可以设置为应用实例的 IP 地址。<endpoint> :获取接入点与 Token 中拿到的接入点。