用户指南

最佳实践

API 文档

文档中心 > 容器服务 > 最佳实践 > 成本管理 > 资源利用率分析和优化建议

资源利用率分析和优化建议

最近更新时间:2021-07-09 10:30:13

操作场景

腾讯云容器服务 TKE 成本优化工具支持分析用户节点资源的资源利用率及范围分布,分析对象包括云服务器、TKE 节点等。支持提供上云成熟度模型,为您提供成本优化建议,提升资源使用率,帮助企业轻松上云,降本增效。

说明

如需获得集群节点资源利用率使用详情,请 提交工单 申请。

资源利用率成熟度模型

通过腾讯云原生团队对授权客户数据的调研,及分析各客户上云阶段的资源利用率情况,得出如下结论:充分利用弹性伸缩能力,是提高资源利用率、降低资源成本的关键点之一。对比未使用弹性伸缩的情况,整体资源利用率能够提高20-30%以上。腾讯云原生团队提出了容器化资源利用率成熟度模型,如下图所示:

第一阶段

传统部署模型,业务为应对不同时间段计算资源使用不同的情况,必须以最高使用资源的峰值加一定的 buff 进行基础设施的采购,平均利用率降低。

第二阶段

简单容器化改造后的业务,上云并容器化改造,利用了容器进行业务混合部署,一定程度提高了资源利用率。

第三阶段

业务进行微服务改造,业务可利用容器和云的弹性伸缩能力,结合 Kubernetes 的 HPA、VPA、CA 等能力,高峰扩容、空闲缩容,极大提高资源利用率。

第四阶段

极致利用云和容器化后的弹性,提高弹性伸缩灵敏度和精度,有离线业务的进行在离线混布,极致提高平均资源利用率。

资源利用率分析

通过 CPU 平均利用率、CPU 高利用率节点(TOP10)、CPU 低利用率节点(TOP10)、CPU 利用率分布饼图等,协助您了解公司业务的资源的使用情况。以下为资源利用率分析示例图:

CPU 平均利用率

CPU 高利用率节点 / CPU 低利用率节点

CPU 利用率分布饼图

成本优化建议

根据您的业务特征,匹配典型的成本浪费现象,并给出解决该浪费现象的成本优化建议。

周期性业务

业务特征

业务流量呈现周期性。通常业务会按照波峰值去申请资源,在负载较低时利用率很低。即使配置了弹性伸缩能力(分钟级),仍然存在优化空间有限的问题。

成本优化建议

  • 业务进行容器化改造后,基于 K8s 的调度编排能力、资源管理,在保障业务的稳定性的同时有效提升资源利用率。
  • 定时弹性伸缩解决方案:
    • cronHPA(Horizontal Pod Autoscaler):达到用户自定义设置的时间后,在30s內自动扩缩 Pod 数量。
    • CA(Cluster Autoscaler):当受到节点资源限制导致 Pod pending 时,再触发节点层级的扩缩容。
    • 对于短时间内的流量突发,支持 TKE 集群秒级弹性扩容 EKS Pod(Elastic Kubernetes Service),无需重新购买节点。

成本优化工具示意图

流量突发性业务

业务特征

业务流量具备不定时突发性,为了保证高峰时期的业务稳定和良好性能,资源规格配置一般会留有较大的 buffer,在日常时存在巨大的资源浪费。

成本优化建议

  • 业务进行容器化改造
    • 基于 K8s 的调度编排能力,支持按照 Pod 真实负载进行动态调度,提升节点资源利用率。
    • 智能资源管理,智能 request 推荐、Resource Quota、Limit Ranges,在保障业务的稳定性的同时有效提升资源利用率。
  • 弹性伸缩解决方案:
    • HPA(Horizontal Pod Autoscaler):在达到用户自定义阈值(CPU利用率、CPU使用量等)时在30s內自动扩缩pod数量。
    • CA(Cluster Autoscaler):当受到节点资源限制导致 Pod pending 时,触发节点层级的扩缩容。
    • 对于短时间内的流量突发,支持TKE集群秒级弹性扩容EKS Pod(Elastic Kubernetes Service),无需重新购买节点。

成本优化工具示意图

目录