前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估

年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估

作者头像
腾讯云原生
发布2023-01-30 10:40:08
1.2K0
发布2023-01-30 10:40:08
举报

2023 年 1 月 9 日云原生产业联盟(CNIA)举办 2022 年度线上年会,中国信通院云大所云计算发布了云原生系列测评成果,腾讯云主导开源的云原生成本优化项目 Crane 首批通过“云原生混部”项目评估

Crane 是国内第一个基于云原生技术的成本优化开源项目,遵循 FinOps 标准,旨在为云原生用户提供云成本优化一站式解决方案。

技术方面,Crane 基于两级调度能力,实现高优先级延迟敏感业务和低优先级高吞吐业务在相同节点上的混合运行。

一级调度能力,确保应用的高效调度,实现真正的“用多少占多少”。

基于应用历史负载信息进行画像构建

基于应用画像和节点画像实现智能调度

基于DSP算法、AI算法等实现弹性预测

二级调度能力,在保障服务质量的同时,实现资源利用率的大幅提升。

节点画像和闲置资源回收。运行在每个节点的代理采集节点负载,基于 DSP等预测算法预测未来负载走势,并将闲置资源回收成为节点扩展资源供低优业务使用。

资源隔离和服务质量保障。定义资源隔离规则,确保当混部业务发生资源竞争时,高优业务的稳定性不受影响;开源方案基于 CPU Quota 完成低优业务的资源压制;闭源方案基于腾讯 TLinux 如意内核完成高优业务的绝对资源抢占。

干扰检测和低优主动回避。节点代理探测资源隔离策略生效后,节点是否依然有干扰发生,如有干扰则驱逐低优业务确保高优业务不受影响。

腾讯云自 2015 年起在混部领域进行探索,在支撑海量自研业务上云的过程中广泛使用。目前管理规模已达数千万核,混部能力使服务器资源利用率从30% 提升至 65%。Crane 在 2022 年开源以后,已经被腾讯自研业务、小红书、网易、思必驰、酷家乐、明源云、数数科技等公司部署在生产系统,其主要贡献者来自腾讯、小红书、谷歌、eBay、微软、特斯拉等知名公司。

《云原生混部技术能力要求》标准的由来

随着企业数字化转型工作深入推进,企业正在通过精细化的资源管理、跨集群跨地域资源协同、灵活快捷的资源编排调度,以及异构资源共享复用等方式,实现灵活的弹性资源供给、更加智能的应用自动部署,以及更大规模节点的算力协同。

云原生混部解决方案依托容器、微服务、平台编排调度等云原生技术,帮助用户将业务负载与大数据分析、人工智能计算等不同优先级的应用混合部署到共享的基础设施上,提高资源利用率,实现“降本增效”。

在此背景下,中国信通院牵头,联合腾讯云等多家云服务商,经过多轮研讨,形成了《云原生混部技术能力要求》标准。

标准涉及基础设施能力要求、平台混部能力要求、业务应用能力要求,以及混部效果评价四个部分,从资源隔离、资源复用、干扰检测、负载反馈、任务调度、资源预测、应用服务质量等不同维度,对混部产品及解决方案进行全面评估。

衍生阅读

Crane 已成功加入 CNCF Landscape,欢迎关注项目,合作共建:

  • Crane Github:GitHub - gocrane/crane: Crane (FinOps Crane) is an opensource project which manages cloud resource on Kubernetes stack, it is inspired by FinOps concepts.(https://github.com/gocrane/crane
  • Crane 官网:Introduction - Crane - Cloud Resource Analytics and Economics(https://docs.gocrane.io/dev/
  • Crane 核心模块:(https://github.com/gocrane/creator
  • [Effective HPA:预测未来的弹性伸缩产品]
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-01-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云原生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 《云原生混部技术能力要求》标准的由来
  • 衍生阅读
相关产品与服务
弹性伸缩
弹性伸缩(Auto Scaling,AS)为您提供高效管理计算资源的策略。您可设定时间周期性地执行管理策略或创建实时监控策略,来管理 CVM 实例数量,并完成对实例的环境部署,保证业务平稳顺利运行。在需求高峰时,弹性伸缩自动增加 CVM 实例数量,以保证性能不受影响;当需求较低时,则会减少 CVM 实例数量以降低成本。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档