Prometheus 监控服务对常用的开发语言/中间件/大数据/基础设施数据库进行了集成,支持一键安装和自定义安装方式,用户只需根据指引即可对相应的组件进行监控,同时提供了开箱即用的 Grafana 监控大盘。集成中心涵盖了基础服务监控、组件监控、应用层监控、业务监控等监控场景,方便您快速接入并使用。
支持服务列表
服务类型 | 服务名称 | 监控项 | 是否支持一键安装 | 接入文档 |
监控 | 云监控 | 集成腾讯云产品基础监控数据,通过 Prometheus 监控进行统一采集、存储和可视化 | 支持 | |
| | | | |
| PTS | 云压测监控,提供压测任务 RPS、响应时间、错误率、压测节点内存/CPU 等监控 | 不支持 | |
开发 | CVM Node Exporter | 自动在 CVM 安装 Node Exporter,采集监控数据 | 支持 | |
| CVM 进程监控 | 自动在 CVM 安装进程监控插件,采集进程监控数据 | 支持 | |
| CVM 云服务器 | 使用扩展的 cvm_sd_config 配置 CVM 抓取任务,采集 node-exporter 或业务自定义指标 | 支持 | |
| 非腾讯云主机监控 | 非腾讯云主机监控,提供 Node Exporter 安装指引并自动采集监控数据 | 支持 | |
| 抓取任务 | 使用原生 static_config 配置抓取任务 | 支持 | |
| Golang | 包括 GC/Heap/Thread/Goroutine 等监控 | 不支持 | |
| JVM | 包括 Heap/Thread/GC/CPU/File 等监控 | 不支持 | |
| Spring MVC | 包括 HTTP 接口/异常/JVM 等监控 | 不支持 | |
巡检 | 健康巡检 | 通过 Blackbox 定期对目标服务进行连通性测试,帮助您掌握服务的健康状况,及时发现异常 | 支持 | |
基础设施 | TKE | Kubernetes 监控,包括 API Server/DNS/Workload/Network 等监控 | 不支持 | |
| Nvidia GPU | 集成 Nvidia GPU 监控数据 | 支持 | |
中间件 | Ingress NGINX Controller | Ingress NGINX Controller 监控 | 支持 | |
| Consul | Consul 监控 | 支持 | |
| | | | |
| Etcd | Etcd 监控 | 不支持 | |
| Istio | Istio 监控 | 不支持 | - |
| Kafka | 包括 Broker/Topic/Consumer Group 等监控 | 支持 | |
| RabbitMQ | RabbitMQ 消息队列指标监控,包括消息速率、队列深度、节点状态等信息 | 支持 | |
| RocketMQ | RocketMQ 监控,包括 Broker/Producer/Consumer Group 等监控 | 支持 | - |
| Fluentd | fluentd 性能监控,包括组件状态、缓冲区使用情况和重试次数等 | 不支持 | |
| Nginx | Nginx 服务指标监控,包括健康状况、性能和负载情况等 | 支持 | |
| Kong | Kong 监控 | 不支持 | |
大数据 | Cdwch | 集成腾讯云数据仓库 ClickHouse 监控数据 | 支持 | - |
| EMR | 集成腾讯云弹性 MapReduce 监控数据 | 支持 | |
| ElasticSearch | 包括集群/索引/节点等监控 | 支持 | |
| Flink | 包括集群/Job/Task 等监控 | 不支持 | |
数据库 | 云数据库 Memcached | Memcached 监控 | 支持 | |
| 云数据库 MongoDB | 包括文档数/读写性能/网络流量等 | 支持 | |
| 云数据库 MySQL | 包括网络/连接数/慢查询等 | 支持 | |
| MSSQL | Microsoft SQL Server 指标监控,包括 SQL Server 性能和健康状况等 | 支持 | |
| 云数据库 PostgreSQL | 包括 CPU/Memory/事务/Lock/读写等监控 | 支持 | |
| 云数据库 Redis | 包括内存使用率/连接数/命令执行情况等监控 | 支持 | |
| Aerospike | aerospike 数据库指标监控,包括集群的健康状况、性能表现和负载情况 | 支持 | |
| Ceph | Ceph 监控,包括集群、OSD、Pools 的状态、性能等 | 支持 | |
| OracleDB | Oracle 数据库指标监控,包括数据库性能、负载、健康状况等 | 支持 | |
其它 | Docker | Docker daemon 监控,包括 docker、container、engine 等信息 | 不支持 | |
| Pushgateway | Prometheus Pushgateway,用于接收 Prometheus 服务发现无法直接监控的短期任务指标数据 | 支持 | |
| Thanos Sidecar | Thanos Sidecar 仅支持查询当前实例功能,不支持写入功能,可以供 Thanos Query 查询实例数据。 | 支持 | - |
| Apache | Apache HTTP 服务监控,包括请求速率、连接数、响应代码等 | 支持 | |
| Graphite | Graphite 指标转换成 Prometheus 指标 | 支持 | - |
| 免鉴权代理 | 无鉴权代理,安装后可获得无需 basic auth 鉴权的 prometheus 内网地址 | 支持 | - |
一键安装
1. 登录 Prometheus 监控服务控制台。
2. 在实例列表中,选择并进入对应的 Prometheus 实例。
3. 在实例详情页,选择数据采集 > 集成中心。
4. 在集成中心选择支持一键安装的服务,下图以 Kafka 为例。


5. 单击 Kafka 即会弹出一个安装窗口,填写指标采集名称和地址等信息,并单击保存即可。

自定义安装
1. 登录 Prometheus 监控服务控制台。
2. 在实例列表中,选择并进入对应的 Prometheus 实例。
3. 在实例详情页,选择数据采集 > 集成中心。
4. 在集成中心选择对应的服务,下图以 CVM 云服务器为例。单击它即会弹出一个窗口,单击安装说明文档查看接入指引(仅支持部分产品),接入成功后即可实时监控对应的服务。您还可以单击 Dashboard 操作,安装或升级该服务的 Grafana Dashboard。

Metric Relabel 配置示例
在支持 Metric Relabel 配置的集成中,可以添加 Prometheus 原生的 metric_relabel_configs 配置,下面是常用的 metric_relabe_configs 示例:
metric_relabel_configs:- action: labeldrop # 去掉名为 labelA 的 label。regex是正则表达式,多个正则表达式用 | 分隔regex: labelA- regex: ins-(.*) # 新增一个名为 id 的 label,其值通过名为 instance_id 的 label 的值经过正则处理后得到。例如 instance_id="ins-a",新得到的 id="a"replacement: $1source_labels:- instance_idtarget_label: id- target_label: region # 新增一个 region="ap-guangzhou" 的 labelreplacement: ap-guangzhou- action: drop # 去掉名为 metricA 或 metricB 的指标source_labels:- __name__regex: metricA|metricB