用户指南

最佳实践

API 文档

基础监控架构升级

最近更新时间:2022-04-02 15:21:39

背景介绍

为了给容器用户提供更稳定的基础监控服务,提升监控数据、告警功能、HPA 扩缩容服务的可用性,腾讯云容器服务基础监控将进行服务升级,升级过程将包含部署新版监控服务组件、切换组件版本、下线旧版本三个阶段,升级过程中对业务运行无影响。

操作详情

第一阶段:部署监控服务组件

将在用户集群 kube-system 命名空间下安装监控数据采集组件:tke-monitor-agent,该 agent 将在每个节点上占用小于 70MB,0.01C 集群资源,组件详情介绍参考 tke-monitor-agent 组件说明

第二阶段:切换组件版本

为保证稳定的数据源,本阶段将在新版本组件部署完成一周后执行。

说明:

  • 集群 kubernetes 版本>=1.8 前提下,将在 kube-system 命名空间下分别新建名称为 metrics-service 的 service 对象和 endpoint 对象,并指向容器侧维护的 metrics-server
  • 集群中的 hpa-metrics-service 将指向新的数据源。若 apiservice v1beta1.metrics.k8s.io 使用的是容器侧提供的默认数据源 kube-system/hpa-metrics-service 且 kubernetes 版本 >=1.8,将切换到数据源更稳定的 kube-system/metrics-service
  • 新增 apiservice v1alpha1.monitor.tencent.io,支持 TKE 虚拟节点上报监控数据,支持查询各个节点上 pod 的监控数据。

第三阶段:下线旧版本监控组件

本阶段将在切换组件版本完成后的一周内执行。

目录