TKE 标准集群指南

最佳实践

API 文档

诚邀爱技术、爱分享的你,成为文档内容共建者> HOT

监控组件能力是一个平台系统的基础支撑组件,边缘容器复用了腾讯云的云监控能力,可以将边缘侧的监控指标通过边缘容器的 “Tunnel 云边通道”上传到云端,提供基础的监控能力。您可根据以下操作查看集群监控信息:

操作步骤

基础监控信息

  1. 登录 容器服务控制台,选择左侧导航栏中的集群
  2. 在集群管理页,单击边缘集群 ID,进入该集群详情页。
  3. 选择页面左侧节点管理 > 节点,进入节点列表页面,单击监控查看具体监控信息,如下图所示:
  4. 查看监控信息,如下图所示:

    具体监控的 Metric 包括:
    • 事件:Pod 重启次数、Pod Ready 状态。
    • CPU:CPU使用量(核)、CPU 利用率(占 limit)、CPU 利用率(占节点)、CPU 利用率(占 request)。
    • 内存:内存使用量(MBytes)、内存使用量(不包含cache)、内存利用率(占节点,不包含cache)、内存利用率(占request)、内存利用率(占request,不包含cache)、内存利用率(占limit)、内存利用率(占limit,不包含cache)、内存利用率(占节点)、内存使用量_working_set、内存利用率_working_set占request、内存利用率_working_set占limit、内存利用率_working_set占节点。
    • 网络:网络入包量(个/s)、网络出流量(MBytes)、网络入流量(MBytes)、网络出带宽(Mbps)、网络入带宽(Mbps)、网络出包量(个/s)。
    • GPU(如果包含):GPU显存使用率(%)、GPU编码资源使用率(%)、GPU解码资源使用率(%)、GPU流处理器使用率(%)。
    • 存储:rootfs 空间大小(MiB)。
说明:

平台默认使能的云监控为免费提供。

云原生监控

平台自带监控信息存在一些不足之处:

  • Metrics 指标较少,同时不能够自定义指标。
  • 同时缺乏云原生相关 Metrics 的监控能力。

因此边缘容器服务也同时支持接入 Prometheus 云原生监控的能力。通过该产品,边缘容器平台可以支持自定义指标,且部署后自带免费节点指标 node-exporter、kubelet 指标,以及集群维度 kube-state-metrics 信息,能够为边缘集群提供完整的云原生监控能力。具体可参考 Prometheus 监控

说明:

此产品为付费产品,请您了解详细特性后按需购买使用。

目录