有奖征文:轻量对象存储LighthouseCOS用户实践> HOT

操作场景

本文介绍如何查看节点池的伸缩记录,适用于以下场景:
您可以通过伸缩活动了解自己业务的流量变化,更有效的按需配置节点池。
您可以通过节点池内节点扩缩容活动来了解自己的花费来源,进行更高效的成本管理。
您可以了解扩缩容活动失败的原因(例如扩容时由于地域资源售罄导致扩容失败),进行风险管理。
您可以查看两个层级的伸缩记录:全局伸缩记录特定节点池伸缩记录
说明
在存在多个节点池的情况下,CA(Cluster Autoscaler)负责选择合适的节点池进行扩缩容,全局伸缩记录可以从 CA 的 Event 得到。
如果您只关心特定节点池的伸缩记录,不关心 CA 的行为,可进入节点池详情页查看该节点池的扩缩容活动记录。

前提条件

已创建可用节点池,详情请参见 创建节点池

操作步骤

查看全局伸缩记录

社区开源组件 CA 会把任何一次扩缩活动的相关信息,以 Kubernetes event 的形式存储到特定的 Pod 或者 Node 下,但存在 Kubernetes events 资源默认后端只存储1小时的限制。若您想对节点池的扩缩记录进行查询及复盘,建议您开启集群的事件持久化功能,对 Kubernetes Events 进行持久存储。

开启事件存储

登录 腾讯云容器服务控制台,为集群开启事件存储,操作步骤请参见 事件存储

查看事件

1. 登录 日志服务控制台,选择左侧导航中的检索分析
2. 检索分析页面,选择地域和日志主题,按需自行配置显示字段并进行检索分析。
3. 在字段中勾选 event.source.component:cluster-autoscaler,单击检索分析
4. 在右侧的版面设置可配置数据列,对关注的列进行可视化。

检索指引

您可参考以下文档,查看更具体的扩缩容活动列表:
CA 扩缩容 Event 的 Reason 字段可能有如下取值:TriggeredScaleUp、NotTriggerScaleUp、ScaledUpGroup、FailedToScaleUpGroup、ScaleDown、ScaleDownFailed、ScaleDownEmpty。详情请参见 字段详细介绍

查看特定节点池伸缩记录

1. 登录 容器服务控制台,选择左侧导航栏中的集群
2. 在集群列表页中,单击集群 ID,进入该集群详情页。
3. 选择左侧菜单栏中的节点管理 > Worker 节点,在节点池中单击目标节点池 ID。如下图所示:



4. 进入该节点池详情页,选择顶端伸缩记录页签,即可查看伸缩记录。如下图所示:



伸缩记录展示字段如下:
活动 ID:伸缩活动 ID。
状态:伸缩活动的状态。
描述:此次伸缩活动的描述,显示扩容机器数/缩容机器数。
活动起因:触发此次伸缩活动的原因,例如“因匹配期望实例数”。
失败原因:如果伸缩活动状态为失败,该栏会显示伸缩活动的失败原因。
开始时间:伸缩活动开始的时间,精确到秒。
结束时间:伸缩活动结束的时间,精确到秒。

相关操作

您可参考以下文档,了解节点池更多功能及操作: