TKE 标准集群指南

最佳实践

API 文档

有奖征文|投稿上云技术实践,赢取价值5000元大奖> HOT

概述

传统的对象管理页面一般都是通过列表形式展开的,例如 TKE 集群里现有的资源对象列表,但列表的展示方式具备如下缺点:每一行都是一些抽象的数字,可读性不高;对象之间没有明确的标识区分;无法支持某种形态的排序。为此,TKE 推出了云原生资产管理的能力,通过可视化的形式,将用户所有的资源对象进行展示,该平台具备丰富的过滤查询、类型聚合、状态展示能力,可以帮助用户快速定位目标对象。

Workload Map 主要通过可视化的页面展示工作负载的各项状态和指标,帮助用户了解当前工作负载的配置量和实际使用情况,辅助用户分析工作负载可能存在的问题。

注意事项

Workload Map 不支持提供超级节点上的 Pod 推荐值的监控数据。在聚合监控指标时,如果有 Workload 的 Pod 在超级节点上,则在统计 Workload 和 Cluster 级别的推荐值时,会缺少部分数据。

使用方式

  1. 登录 容器服务控制台
  2. 在左侧选择云原生资产管理 > Workload Map
  3. 在“Workload Map”页面中,选择地域集群类型集群后,进行查看。

Workload Map 功能说明

Workload Map 分为概览和资源对象热图,如下图所示:

  1. 上半区域是集群里的 Workload 概览。
  2. 下半区域是集群里的每一个 Workload 资源对象。

工作负载概览

工作负载概览如下图所示:

  • 工作负载概览:展示当前集群中是有推荐 Request 的工作负载的数量和所占比例;展示当前集群节点的总核数和总内存数。
    注意:

    首先需要打开 Request 推荐功能,才会推荐工作负载调整 Request 数值。更多请参考 Request 推荐

  • CPU 用量:集群中工作负载的 CPU 用量情况。
    • 申请量:集群中所有工作负载中所有 Pod 的 Request 的 CPU 之和。
    • 实际用量:集群中所有工作负载中所有 Pod 实际的 CPU 用量之和。
    • 推荐量:集群中所有工作负载中所有 Pod 推荐的 CPU 用量之和。需要提前开启 Request 推荐。
  • 内存用量:集群中工作负载的内存用量情况。
    • 申请量:集群中所有工作负载中所有 Pod 的 Request 的内存之和。
    • 实际用量:集群中所有工作负载中所有 Pod 实际的内存用量之和。
    • 推荐量:集群中所有工作负载中所有 Pod 推荐的内存用量之和。需要提前开启 Request 推荐。

工作负载对象查看

工作负载对象如下图所示,您可以通过工作负载的筛选、聚合、状态进行 Workload 的过滤和聚合展示。

  • 筛选:根据相关指标筛选得到目标 Workload,若您不选择,则是默认选择了所有的Workload。支持过滤多个属性,取交集。
  • 聚合:对筛选出来的 Workload 进行分组,每一组节点在同一个浅色框内,一个框内的每个 Workload 具有相同的属性值。
  • 状态:您可以通过状态进行筛选,支持选择CPU 利用率峰值、CPU 利用率均值CPU 装箱率
    • CPU 利用率峰值:Workload CPU 均值利用率,分24小时,7天,30天维度。
    • CPU 利用率均值:节点 CPU 峰值利用率,分24小时,7天,30天维度。
    • CPU 装箱率:节点 CPU 均值装箱率,分24小时,7天,30天维度。
      注意:

      在工作负载对象热图里的节点,默认按照当前选择的“状态”属性值进行升序排列。例如,您选择的工作负载状态是 “24h CPU 利用率均值”,则工作负载对象热图里的工作负载默认是按照工作负载24h CPU 利用率均值升序排列。

      筛选后的 Workload 由绿、蓝、红三色区分。您可以单击页面右下角的,调整三种状态的阈值范围。如下图所示:

工作负载操作

当您的鼠标悬浮在工作负载对象上后,您可以查看当前工作负载的详情信息,并进行如下操作:

  1. 单击详情,查看当前工作负载的详情信息。
    • 功能开关
      • Request 推荐:集群级别的功能开关。开启后,可以根据 Workload 的使用情况,给 Workload 推荐合适的 Request。更多请参考 Request 推荐
      • 推荐值(蓝色字体):标识当前工作负载的 Request 推荐值,单击后支持更新(仅在开启 Request 推荐且有推荐值的情况下展示)。
    • 工作负载信息

      • 24h 利用率均值:工作负载 CPU 和内存24小时均值利用率。
      • 24h 利用率峰值:工作负载 CPU 和内存24小时峰值利用率。
    • 工作负载走势图信息

      • CPU 用量:当前工作负载的 CPU 用量情况。
        • 申请量:当前工作负载中所有 Pod 的 Request 的 CPU 数值之和。
        • 实际用量:当前工作负载中所有 Pod 实际的 CPU 用量之和。
        • 推荐量:当前工作负载中所有 Pod 推荐的 CPU 用量之和。需要提前开启 Request 推荐。
      • 内存用量:当前工作负载的内存用量情况。
        • 申请量:当前工作负载中所有 Pod 的 Request 的内存数值之和。
        • 实际用量:当前工作负载中所有 Pod 实际的内存用量之和。
        • 推荐量:当前工作负载中所有 Pod 推荐的内存用量之和。需要提前开启 Request 推荐。
  2. 单击推荐,展示当前工作负载的 Request 推荐值。(仅开启 Request 推荐且有推荐值的情况下,支持单击)
  3. 单击删除,将删除该工作负载。
目录