Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >腾讯推出国内首个云原生成本优化开源项目 Crane

腾讯推出国内首个云原生成本优化开源项目 Crane

作者头像
腾讯云原生
发布于 2022-03-21 04:10:29
发布于 2022-03-21 04:10:29
6.1K0
举报

王孝威,FinOps 认证从业者,腾讯云技术产品经理,Crane 产品负责人。

云资源管理现状

设想你是一个应用开发人员,编写业务代码是你的主业,应用需要多少资源,往往通过压测决定,这导致非业务高峰期时段巨大的资源浪费。正好,社区和公司都在积极推动云原生,声称可以利用其强大的调度和弹性解决资源浪费问题。你兴致勃勃的拥抱云原生,但最终发现,云原生业务的资源配置,同样还是需要压测这种传统而手工的方式。

又比如你是一个平台侧运维人员,你背负着提升平台资源利用率的 KPI。集群内运行着众多负载规律波动的应用,你惊喜的发现,Kubernetes 提供了自动扩容能力,你很想试试看。但真正使用了HPA,从负载上升触发阈值,到弹性控制器开始扩容,到应用启动完成,可能有数分钟甚至数十分钟的滞后,在弹性起作用之前,应用已经被压垮。于是你抛弃自动弹性能力,继续回归到锁定超量资源的老路上来。

研发人员到底能否从资源配置的深渊中解脱出来,是否能让弹性能力高效实用?于是你带着问题去社区寻找答案。你发现将应用代码和基础架构彻底分离的 Serverless 技术似乎是一个选项,但是随着深入了解你发现,Serverless 只是一个概念,不是一个标准,由于完全抛弃了服务器,底层自主可控和性能优化能力完全丧失;另一类是以谷歌 Autopilot 集群为首的资源托管类集群,这类集群应该满足你的诉求,但它平台绑定并且需要付费。

我们决定改变现状,我们在对腾讯内部业务做成本优化时积累了众多经验,结合资源预测、智能弹性和全构混部能力,在不牺牲稳定性的前提下,将集群峰值利用率提升到了50%以上下图是优化的效果。我们期待与社区同道一起优化应用资源配置和弹性的共性问题,于是我们给大家一个不重造轮子的可能,选择了开源。

图1:Crane 在大规模场景下的优化效果

Crane 的诞生:首款企业成本优化的开源工具

为推进云原生用户在确保业务稳定性的基础上做到真正的极致降本,腾讯推出了国内第一个基于云原生技术的成本优化开源项目 Crane( Cloud Resource Analytics and Economics )。Crane 遵循 FinOps 标准,旨在为云原生用户提供云成本优化一站式解决方案

当前 Crane 项目主要贡献者包括有腾讯、小红书、谷歌、eBay、微软、特斯拉等知名公司的行业专家。

(Crane 开源项目地址:https://github.com/gocrane/crane/

符合 FinOps 标准的 Crane 成本优化工具能力模型

Crane 是腾讯内部云资源优化流程方法和工具的系统性输出,同时,Crane 核心能力的构建与规划均与 FinOps 基金会提出的能力模型完全契合。

图2:Crane 能力模型

Crane 架构与特性

图3:Crane 架构

Crane 致力于推荐资源和智能弹性配置,业务人员无需再为业务需要多少资源,自动扩缩容应该如何配置等问题而烦恼,Crane 会基于业务的时序变动数据给出最优解。

一键部署

Crane 保持平台独立,通过一个 Helm 包将 Crane 安装至任意 Kubernetes 集群,无论云上还是云下,即可享受一站式资源优化能力。Crane 侵入性小,核心组件包括集中控制器 craned 和节点代理 crane agent,你可以自由组合安装,通过 featureGate 选择开启哪些能力。

简单易用可视化控制台

为降低使用门槛,Crane 提供内置控制台,用户可基于控制台查看成本分配,成本走势,并通过鼠标点击实现成本优化。所有能力均提供灰度控制和预览模式,以及回滚的能力,以消除业务侧对资源变动的顾虑。

开箱即用的巡检能力

Crane 可以全局扫描整体浪费情况,将隐藏浪费可视化的呈现出来,使运维人员免除拉取监控数据,编写查询脚本等重复性工作。

优化方案包含对成本变化的展示,对利用率变化的展示,可能的风险点,甚至是优化建议的排序。因为我们相信,每个业务都是独一无二的,都有其最适合的优化方案,不能一概而论。

即时迅速的弹性 (EffectivePodAutoscaler(EPA))

传统基于事件的弹性工具会导致一个天然缺陷——当业务指标偏离正常值后才会触发弹性,这种滞后性使得云用户不敢使用弹性。EPA 支持可扩展的预测算法,以预测结果驱动横向和纵向弹性,确保业务能提前弹出来,彻底避免原生弹性能力未弹先死的尴尬。同时 Crane 将社区的 HPA 和 VPA 两种弹性能力统一起来,提出了弹性概念 EPA。

图4:EPA 确保工作负载提前扩容

稳定性与资源优化的双重兼

Crane 对资源利用率的提升,绝不是以牺牲稳定性作为代价。Crane 允许用户对业务进行定级,节点代理负责周期性检查节点资源水位和系统指标,识别应用干扰,并通过调度禁止,调整 cgroup,驱逐等多种手段确保敏感业务服务等级不受损。

Crane 现状与未来

当前 Crane 已发布0.2.0版本,具备了资源推荐,弹性推荐,智能弹性和稳定性增强等核心能力,更多开发计划请参考里程碑[1]

延伸阅读

FinOps[2] (Financial Operations) 定义了一系列云财务管理规则和最佳实践,通过助力工程和财务团队、技术和业务团队彼此合作,进行数据驱动的成本决策,使组织能够获得最大收益。

秉承着用户为本,科技向善的核心价值观,腾讯云将内部云资源优化的经验、方法、工具以开源的形式分享给社区,助力云用户云成本优化视为自己的使命与责任。2021年12月,腾讯成为 FinOps 基金会顶级会员,致力于云资源优化理念的推广与技术输出。

加入我们

Crane 项目开源进行时,欢迎关注 https://github.com/gocrane/crane/ 收藏/Star支持。

我们正在限量召集 Crane 的第一批开源技术粉丝,只要你对 Crane 及相关技术感兴趣,都欢迎加入,参与方式:添加腾小云二维码,回复:Crane,小云会拉你进群。

参考资料

[1]

里程碑: 【https://github.com/gocrane/crane/blob/main/docs/roadmaps/roadmap-1h-2022.md】

[2]

FinOps: 【https://www.finops.org/introduction/what-is-finops/】

  往期精选推荐  

点个“在看”每天学习最新技术

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云原生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
国内首家!腾讯云正式成为 FinOps 基金会顶级会员
11月24日,腾讯云正式宣布加入FinOps基金会,作为国内首家FinOps基金会顶级会员,腾讯云将联合FinOps基金会,全面推进对FinOps标准和最佳实践的贡献,为企业提供云财务管理的最佳解决方案。
腾讯云原生
2021/11/24
1.3K1
腾讯推出国内首个云原生成本优化开源项目 Crane
一 云资源管理现状 设想你是一个应用开发人员,编写业务代码是你的主业,应用需要多少资源,往往通过压测决定,这导致非业务高峰期时段巨大的资源浪费。正好,社区和公司都在积极推动云原生,声称可以利用其强大的调度和弹性解决资源浪费问题。你兴致勃勃的拥抱云原生,但最终发现,云原生业务的资源配置,同样还是需要压测这种传统而手工的方式。 又比如你是一个平台侧运维人员,你背负着提升平台资源利用率的 KPI。集群内运行着众多负载规律波动的应用,你惊喜的发现,Kubernetes 提供了自动扩容能力,你很想试试看。但真正使用
腾源会
2022/03/24
1.4K0
年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估
2023 年 1 月 9 日云原生产业联盟(CNIA)举办 2022 年度线上年会,中国信通院云大所云计算发布了云原生系列测评成果,腾讯云主导开源的云原生成本优化项目 Crane 首批通过“云原生混部”项目评估。 Crane 是国内第一个基于云原生技术的成本优化开源项目,遵循 FinOps 标准,旨在为云原生用户提供云成本优化一站式解决方案。 技术方面,Crane 基于两级调度能力,实现高优先级延迟敏感业务和低优先级高吞吐业务在相同节点上的混合运行。 一级调度能力,确保应用的高效调度,实现真正的“用多少占多
腾讯云原生
2023/01/30
1.3K0
年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估
在线业务极致伸缩、CPU 利用率达 60%,涂鸦的云原生资源优化实践
在容器化的基础上,我们已经通过一些手段,比如监控分析、弹性伸缩等降低了 k8s 集群的成本,取得了一定的成效。
深度学习与Python
2024/01/11
4461
在线业务极致伸缩、CPU 利用率达 60%,涂鸦的云原生资源优化实践
【腾讯云Finops Crane集训营】降本增效神器Crane实战记录
这段时间有幸参与了一下腾讯Finops Crane集训营的Crane公开体验训练营。
程序员洲洲
2024/06/07
2700
【腾讯云Finops Crane集训营】降本增效神器Crane实战记录
Crane 发布国内首个云原生应用碳排放计算优化器
孟凡杰,腾讯云容器技术专家,FinOps产品研发负责人。 为了共同应对气候变化挑战,减缓全球变暖趋势,2015 年 12 月,近 200 个缔约方共同通过了《巴黎协定》(The Paris Agreement),对 2020 年后全球如何应对气候变化做出了行动安排。为实现这一目标,全球多个国家宣布要实现碳中和。 全球气候行动峰会发布的《指数气候行动路线图》显示,数字科技在能源、制造业、农业、建筑、交通等领域的解决方案,可以帮助全球减少 15% 的碳排放,是实现碳减排的关键技术因素。云计算平台是数据中心基础设
腾讯云原生
2022/12/15
2.2K1
Crane 发布国内首个云原生应用碳排放计算优化器
成本最高降低70%,腾讯大规模业务集群的云原生成本优化实践!
唐聪,腾讯云容器技术专家,极客时间专栏《etcd实战课》作者,开源项目kstone和crane内部雏形版 founder,etcd活跃贡献者,主要负责腾讯云大规模k8s和etcd平台稳定性和性能优化、业务集群成本优化、有状态服务容器化等产品研发设计工作。 背景 2021年下半年以来,在新冠疫情和互联网政策的冲击之下,各大互联网公司都在进行降本增效。降本增效的一大核心手段就是优化计算资源成本,本文将以腾讯某内部 Kubernetes/TKE 业务为案例,详细阐述如何从 0到1(成本数据采集与分析、优化措施、行
腾讯云原生
2022/07/01
3K0
成本最高降低70%,腾讯大规模业务集群的云原生成本优化实践!
无处不在的离线算力-Crane 基于 Virtual Kubelet 的实践
陈凯悦,腾讯云高级开发工程师,Crane和SuperEdge项目核心开发。专注于大规模离在线混部和资源调度,目前负责Crane离在线混部和调度相关工作。 孟凡杰,腾讯云容器专家工程师,Crane项目发起人,致力于云原生成本优化,腾讯云降本产品研发负责人。 背景 用户使用云时,为不同特征的业务完成精确的资源配置不是一件容易的事情。FinOps 时代如何玩转应用资源配置 提供了诸多最佳实践。我们再来借助下图的单节点资源使用情况探讨一下资源合理利用的挑战,为简化问题,我们只关注核心资源 CPU。 假设该节点总计
腾讯云原生
2023/05/04
9990
无处不在的离线算力-Crane 基于 Virtual Kubelet 的实践
【愚公系列】深入探索《2023腾讯云容器和函数计算技术实践精选集》:案例解析与实用建议
在当今快速演进的技术景观中,云原生架构已经成为推动企业创新和敏捷性的主要力量。核心技术如Docker容器、Serverless计算、微服务架构,不仅重塑了软件开发和部署的方式,而且也重新定义了如何构建、运行和维护现代应用程序。这篇文章以《2023腾讯云容器和函数计算技术实践精选集》为例深入探讨这些技术如何协同工作,以及它们如何共同构成了一个强大、灵活且可扩展的云原生生态系统。
愚公搬代码
2024/04/01
2110
全球首家!Crane成FinOps首个认证降本增效开源方案
喜讯 刚刚,腾讯云开源项目Crane (Cloud Resource Analytics and Economics)正式成为 FinOps 认证解决方案(FinOps Certified Solutions)。作为全球范围内首个开源的 FinOps 认证解决方案,Crane 能够助力云原生用户充分发挥云上资源的最大价值,帮助企业降本增效。 为推进云原生用户在确保业务稳定性的基础上做到真正的极致降本,腾讯云率先在国内推出了第一个基于云原生技术的成本优化开源项目 Crane。Crane 遵循 FinOps
腾讯云原生
2022/11/29
1.6K0
全球首家!Crane成FinOps首个认证降本增效开源方案
【腾讯云 Finops Crane 集训营】安装使用及EHPA弹性演示
随着时间的推移,降本增效成为了企业界和组织中的一个新口号。在2023年,这个口号进一步获得了广泛的认可和重要性,成为了许多组织在业务运营中的关键目标。在2023年,许多组织开始将降本增效作为战略性目标,并将其融入到整个组织的文化和运营流程中。这需要组织内部的各个部门和团队共同努力,从高层管理层到基层员工,都需要意识到降本增效的重要性,并为之努力。 降本增效的方法多种多样,其中一个关键领域是技术和数字化转型。组织通过采用新技术、数字化工具和自动化流程来改进业务流程和运营效率。例如,采用先进的数据分析和人工智能技术,组织可以更好地理解和优化成本结构,找到潜在的成本节约机会。同时,云计算和容器化技术如Kubernetes等的应用,也为降本增效提供了新的机会,通过资源优化和自动化管理来降低成本并提高效率。 那么今天就为大家介绍Crane
指剑
2023/05/31
5740
【腾讯云 Finops Crane 集训营】安装使用及EHPA弹性演示
Crane如何做到利用率提升3倍稳定性还不受损?
陈凯悦,腾讯云高级开发工程师,Crane和SuperEdge项目核心开发。专注于大规模离在线混部和资源调度,目前负责Crane离在线混部和调度相关工作。 颜卫,腾讯高级开发工程师,Crane项目核心开发。专注于Kubernetes大规模集群管理和成本优化,丰富的超大规模集群管理和混部经验。目前负责Crane离在线混部和资源优化相关工作。 作为云平台用户,我们都希望购买的服务器物尽其用,能够达到最大利用率。然而要达到理论上的节点负载目标是很难的,计算节点总是存在一些装箱碎片和低负载导致的闲置资源。下图展示了
腾讯云原生
2022/12/08
1.1K0
Crane如何做到利用率提升3倍稳定性还不受损?
【腾讯云 FinOps Crane 集训营】Crane平台介绍与实践
Crane是一个开源的容器编排工具 ,Crane提供了一种简单而灵活的方式来管理容器应用程序的生命周期,包括构建、部署、运行和维护。它支持多个容器编排引擎,如Docker Compose、Kubernetes和Mesos等。
知识浅谈
2023/05/10
1K0
【腾讯云 FinOps Crane 集训营】Crane平台介绍与实践
腾讯云原生成本优化平台FinOps Crane荣获国家级大奖!
8月2日,云计算中心科技奖办公室公布2022“云计算中心科技奖”获奖名单,腾讯云原生成本优化平台FinOps Crane荣获“云计算中心科技奖卓越奖”,这也是国内首个云原生工具获得此殊荣奖项!
腾讯云原生
2022/08/08
1.2K0
腾讯云原生成本优化平台FinOps Crane荣获国家级大奖!
赢麻了!Crane 摘得「年度开源影响力项目奖」!
在 CSDN 2022 IT 技术影响力年度榜单评选中,FinOps Crane 荣获「2022 中国开发者影响力榜单  年度开源影响力项目」! “CSDN 2022 IT 技术影响力年度榜单”, 由 CSDN 、《新程序员》主办,面向企业、产品、个人评选出产业奖项、合作伙伴奖项和 CSDN 社区奖项等。 为推进云原生用户在确保业务稳定性的基础上做到真正的极致降本,腾讯云推出了国内首个基于云原生技术的成本优化开源项目——Crane(Cloud Resource Analytics and Economic
腾讯云原生
2023/01/30
4900
赢麻了!Crane 摘得「年度开源影响力项目奖」!
【喜报】Crane 获得“数博会领先科技成果优秀项目奖”
5月26号,以“数实相融 算启未来”为主题的2023中国国际大数据产业博览会在贵阳举行,会上发布了面向全球广泛征集的数博会领先科技成果奖以及优秀项目奖。
腾讯云原生
2023/06/09
3791
【喜报】Crane 获得“数博会领先科技成果优秀项目奖”
【腾讯云 Finops Crane集训营】Finops Crane究竟能为我们带来什么价值和思考?深入探究Crane
最近报名参加了腾讯大型开源项目Finops Crane的集训营,深入了解并实践运用了关于Crane的一系列功能。云计算以及云平台是未来服务部署的主流趋势,可以在成本条件限制下极大节省运行部署成本。因此关于云计算平台的一系列计算我都十分感兴趣,而Crane能够在云原生发展火热的状态下作为大型开源项目,提供学习渠道以及实践,是一件十分有意义的事情。本篇文章将带大家了解Crane以及了解Crane能够帮助我们在哪些业务场景下解决困难,以及我们该如何使用Crane和部署服务。
fanstuck
2025/01/21
2550
【腾讯云 Finops Crane集训营】Finops Crane究竟能为我们带来什么价值和思考?深入探究Crane
【腾讯云 findops Crane集训营】深入了解 Crane 开源项目之实验操作指南
随着云原生技术的发展,越来越多的公司正在选择将应用运行在云上或者自建的 Kubernetes 集群上,但是许多机构的调研发现,绝大多数的用户集群资源利用率并不高,浪费严重。本次训练营将会演示如何快速搭建一个 Kubernetes+Crane 环境,以及如何基于 Crane 优化你的集群和应用。
用户10216580
2023/10/16
3250
【腾讯云 findops Crane集训营】深入了解 Crane 开源项目之实验操作指南
腾讯云Crane成FinOps全球首个认证降本增效开源方案
作者 | Tina 刚刚,腾讯云开源项目 Crane(Cloud Resource Analytics and Economics) 正式成为 FinOps 认证解决方案(FinOps Certified Solutions)。作为全球范围内首个开源的 FinOps 认证解决方案,Crane 能够助力云原生用户充分发挥云上资源的最大价值,帮助企业降本增效。 据了解,为推进云原生用户在确保业务稳定性的基础上做到真正的极致降本,腾讯云率先在国内推出了第一个基于云原生技术的成本优化开源项目 Crane。Cra
深度学习与Python
2023/03/29
7930
腾讯云Crane成FinOps全球首个认证降本增效开源方案
【腾讯云 Finops Crane 集训营】深入了解 Crane 开源项目,集训营实验操作指南,体验过程总结
最近有幸参与了腾讯云举办的Finops Crane的集训营。在这个过程中,老师认真指导,让我受益非浅,也让我真正理解了这一产品所带来的意义。
拿我格子衫来
2023/08/24
5820
【腾讯云 Finops Crane 集训营】深入了解 Crane 开源项目,集训营实验操作指南,体验过程总结
推荐阅读
国内首家!腾讯云正式成为 FinOps 基金会顶级会员
1.3K1
腾讯推出国内首个云原生成本优化开源项目 Crane
1.4K0
年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估
1.3K0
在线业务极致伸缩、CPU 利用率达 60%,涂鸦的云原生资源优化实践
4461
【腾讯云Finops Crane集训营】降本增效神器Crane实战记录
2700
Crane 发布国内首个云原生应用碳排放计算优化器
2.2K1
成本最高降低70%,腾讯大规模业务集群的云原生成本优化实践!
3K0
无处不在的离线算力-Crane 基于 Virtual Kubelet 的实践
9990
【愚公系列】深入探索《2023腾讯云容器和函数计算技术实践精选集》:案例解析与实用建议
2110
全球首家!Crane成FinOps首个认证降本增效开源方案
1.6K0
【腾讯云 Finops Crane 集训营】安装使用及EHPA弹性演示
5740
Crane如何做到利用率提升3倍稳定性还不受损?
1.1K0
【腾讯云 FinOps Crane 集训营】Crane平台介绍与实践
1K0
腾讯云原生成本优化平台FinOps Crane荣获国家级大奖!
1.2K0
赢麻了!Crane 摘得「年度开源影响力项目奖」!
4900
【喜报】Crane 获得“数博会领先科技成果优秀项目奖”
3791
【腾讯云 Finops Crane集训营】Finops Crane究竟能为我们带来什么价值和思考?深入探究Crane
2550
【腾讯云 findops Crane集训营】深入了解 Crane 开源项目之实验操作指南
3250
腾讯云Crane成FinOps全球首个认证降本增效开源方案
7930
【腾讯云 Finops Crane 集训营】深入了解 Crane 开源项目,集训营实验操作指南,体验过程总结
5820
相关推荐
国内首家!腾讯云正式成为 FinOps 基金会顶级会员
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档