查看 TKE 集群控制面组件监控

最近更新时间:2025-02-27 17:55:12

我的收藏

使用场景

腾讯云容器服务 TKE 是一种托管的 Kubernetes 服务,TKE 自动管理 Kubernetes 控制平面节点的可用性和可扩展性,这些节点负责调度容器、管理应用程序可用性、存储集群数据和其他关键任务。但某些工作负载行为或配置可能会增加控制平面的负载,从而导致性能下降。在这些情况下,访问关键控制面指标和监控图表使集群管理员能够快速检测和排除集群上运行的工作负载的问题。例如,资源不足的工作节点可能会妨碍调度程序调度新 Pod 的能力。为了及时检测这些新出现的调度问题,集群管理员需要访问调度程序指标以查看待处理的 Pod 并及时收到通知。此外,控制面指标数量庞大,即使是经验丰富的管理员也面临选择最佳监控指标和创建有效监控图表的挑战。
TKE 提供了集群控制面组件的监控能力,使集群管理员能够查看 Kubernetes 集群控制面的性能,快速检测、排除故障并修复问题。TKE 集群通过 Prometheus 监控提供监控图表。

前提条件

已将监控组件 clustermonitor 升级到 1.3.2 版本以上。
已开通 Prometheus 监控服务并关联实例。操作详情请参见 腾讯云 Prometheus 一键关联监控容器服务

操作步骤

1. 登录 容器服务控制台,选择左侧导航栏中的集群
2. 集群管理页面,单击目标集群ID,进入集群详情页。
3. 选择左侧导航中的 Prometheus 监控
4. 可通过一键开通 Prometheus 监控关联已有 Prometheus 实例开启 Prometheus 监控。

5. 在 Prometheus 监控页面中,单击监控详情,单击核心组件监控

在该页面,您可以查看 API Server、Kube Scheduler、Controller Manager 监控大盘。

相关文档

kube-apiserver 组件:指标列表、对应监控大盘的使用说明,请参见 kube-apiserver 组件指标说明
kube-scheduler 组件:指标列表、对应监控大盘的使用说明,请参见 kube-scheduler 组件指标说明
kube-controller-manager 组件:指标列表、对应监控大盘的使用说明,请参见 kube-controller-manager组件指标说明
如何基于用户自建的 Prometheus,采集 TKE 集群的控制面组件监控 API Server、Scheduler、KCM 指标配置说明及推荐的告警配置,请参见 用户自建 Prometheus 采集控制面监控和告警