各位读者朋友们:大家好!
2021年即将结束,这一年中,云原生迅速发展,越来越多的优秀开发者为其作出贡献。「腾讯云原生」有幸参与其中,贡献了非常多优质的技术文章,同时腾讯云容器产品也秉承初心为不断迭代更新,致力于为用户提供更好的服务!
回顾这一年,我们共发布了 248 篇文章,平均每月分享 20 篇文章,腾讯内部和外部开源社区的技术专家们积极分享了自己对于「云原生」技术和实践的思考。
我们评选出了【最受开发者欢迎】和【最具影响力】的 20 篇文章,给 2021 年一个总结。
与君共享~
最受开发者欢迎 TOP10
评选维度:文章的综合阅读量,点赞数与好评数,读者的反馈热度等。
NO.1 :KubeCon 2021|使用 eBPF 代替 iptables 优化服务网格数据面性能
作者:刘旭
性能一直是用户十分关心的一个点,也是用户评估是否使用服务网格产品的关键因素,腾讯云 TCM 团队一直致力于优化服务网格性能。12月初,在 KubeCon 2021 上,腾讯云高级工程师刘旭分享了使用 eBPF 代替 iptables 优化服务网格数据面性能的方案。
NO.2 :谷歌每年节省上亿美金,资源利用率高达60%,用的技术有多厉害!
作者:田奇
在离线混部,指的就是将离线作业和在线服务部署到同一个节点,以此来提高资源利用率,减少企业对与日俱增的离线计算资源的成本开支。未来的混部发展,第一是无差别混部;第二是混部+弹性的极致结合。
NO.3 :Dapr | 云原生的抽象与实现
作者:钟华
Dapr 是微软主导的云原生开源项目,2019年10月首次发布,到今年2月正式发布 V1.0 版本。Dapr 是一个为应用提供分布式能力的运行时,发展势头迅猛,业界关注度非常高。腾讯云专家对 Dapr 分别和 Service Mesh & Istio 进行了分析和比较。
NO.4 :Kubernetes 降本增效标准指南 | 基于K8s 扩展机制构建云上成本控制系统
作者:王玉君,晏子怡
随着企业上云进入稳定期,成本控制就是永远逃不开的话题。本文分享了 Kubernetes 的扩展机制 Admission Webhook、Scheduler Framework 和CRD+Operator,结合云上资源的特异性,介绍如何基于Kubernetes和云上环境构建成本控制系统。
NO.5 :云原生的弹性 AI 训练系列之一:基于 AllReduce 的弹性分布式训练实践
作者:高策,张望
为了解决目前在云原生 AI 场景下的成本高,资源利用率低等问题,TKE AI 团队在 Kubeflow 社区中推动了弹性训练特性的设计与实现。本文介绍了数据并行的分布式训练任务的弹性能力在 Kubernetes 上的设计与实现。并且通过实验的方式验证了特定的场景下,在保证训练精度的同时,这一特性能够使成本降低 70%。
NO.6 :QPS 最高提升 91% | 腾讯云 TKE 基于 Cilium eBPF 提升 k8s Service 性能
作者:朱瑜坚,张浩
eBPF 是一项革命性技术,它可以以一种安全的方式在内核中许多 hook 点执行程序。本文介绍了 TKE 团队实现的基于 Cilium 和 eBPF 的独立网卡模式下高性能 ClusterIP service 方案,该方案相比当前基于 iptables 和 ipvs 的传统网络方案大量的提升了性能(33%-91%)。
NO.7 :内存回收导致关键业务抖动案例分析-论云原生OS内存QoS保障
作者:蒋彪
云原生场景,相比于传统的 IDC 场景,业务更加复杂多样,而原生 Linux kernel 在面对云原生的各种复杂场景时,时常显得有些力不从心。本文基于腾讯云原生场景中的实际案例,展现针对类似问题的一些排查思路,并希望借此透视 Linux kernel 的相关底层逻辑以及可能的优化方向。
NO.8 :大数据云原生系列| 微信 Flink on Kubernetes 实战总结
作者:涂小刚,王玉君
架构转型,拥抱云原生服务生态。一方面我们提供最基础的 Flink 计算平台能力,借助 Kubernetes 有效管控集群,另一方面我们在已有的数据通道及元数据平台上构建实时数仓,提供 Flink SQL 能力,进一步降低用户使用门槛。
NO.9 :基于 Clusternet 与 OCM 打造新一代开放的多集群管理平台
作者:腾讯云原生团队
云计算行业正在迎来了新一轮的增长,国内外厂商和开源社区率先行动,分别发布并开源了 OCM 项目和 Clusternet 项目,统一管理多云多集群下的 Kubernetes 应用,将云原生下沉实现云边端一体化。基于 OCM 与 Clusternet 打造新一代开放的多集群管理系统,管理从中心到边缘,从机房到终端的“集群网络”。
NO.10 :游戏案例|Service Mesh 在欢乐游戏的应用演变和实践
作者:陈智伟
不停服,不变更前端,用户无感的平滑过渡至云上 ServiceMesh,大幅降低成本,提升研运效能。
最具影响力 TOP10
评选维度:技术社区、科技媒体、自媒体等渠道的转载数据和综合阅读量等。
NO.1 :腾讯云联合中国信通院&作业帮等首发《降本之源-云原生成本管理白皮书》
作者:腾讯云原生团队
在11月举办的2021腾讯数字生态大会云原生专场上,腾讯云联合中国信通院、作业帮等率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书),基于腾讯云在业内最大规模的 Kubernetes 实践经验,系统性呈现云原生成本优化方法论和最佳实践路径。
NO.2 :腾讯TencentOS 十年云原生的迭代演进之路
作者:蒋彪
TencentOS 在腾讯内部已经经历了超过10年的迭代和演进,承载支撑了腾讯所有业务,商用部署节点超300w,经受住了海量复杂业务模型在极端场景中的极限考验。
NO.3 :Clusternet - 新一代开源多集群管理与应用治理项目
作者:徐迪,汝英哲
Clusternet ( Cluster Internet ) 是腾讯云开源的兼具多集群管理和跨集群应用编排的云原生项目,让管控多集群就像上网一样简单。
NO.4 :qGPU on TKE - 腾讯云发布下一代 GPU 容器共享技术
作者:腾讯云原生团队
qGPU on TKE 依托腾讯云 TKE 对外开源的 Nano GPU 调度框架,可实现对 GPU 算力与显存的细粒度调度,并支持多容器共享 GPU 与多容器跨 GPU 资源分配。同时依赖底层强大的 qGPU 隔离技术,尽最大可能保证业务性能与资源不受干扰。
NO.5 :重磅丨腾讯云开源业界首个 etcd 一站式治理平台 Kstone
作者:腾讯云原生团队
在 CNCF 云原生基金会举办的2021年12月9日 KubeCon China大会上,腾讯云容器 TKE 团队发布了 Kstone etcd 治理平台开源项目。Kstone 是腾讯云容器 TKE 团队发起的一个基于 Kubernetes 的云原生一站式 etcd 治理项目
NO.6 :揭秘有状态服务上 Kubernetes 的核心技术
作者:唐聪
快速帮助你理解有状态服务的容器化疑难点,并能基于自己的有状态服务场景能灵活选择解决方案,高效、稳定地将有状态服务容器化后跑在 Kubernetes 上,提高开发运维效率和产品竞争力。
NO.7 :智能 Request 推荐,K8s 资源利用率提升 252%
作者:王孝威 余宇飞
TKE 成本大师推出了 Request 智能推荐的工具。用户可以通过标准 Kubernetes API 访问相应的推荐值。
NO.8 :大规模服务网格性能优化 | Aeraki xDS 按需加载
作者:钟华
TCM 团队设计了一套无入侵的 xDS 按需加载方案,并开源到 github Aeraki 项目,有效解决了 Istio 在大规模场景下 xDS 性能瓶颈。
NO.9 :腾讯云 TKE 团队提交 KEP:使用 cgroups v2 实现 Memory QoS
作者:徐蓓
随着云原生进入深水区,很多用户希望通过业务混部提升集群利用率。但由于 kernel 限制,部分资源隔离性不强,会导致业务受损。在这种背景下,腾讯云 TKE 团队向 Kubernetes 社区提交了KEP-2570: Support Memory QoS with cgroups v2,以希望解决内存隔离和服务质量问题。
NO.10 :如何在 Istio 中支持 Dubbo、Thrift、Redis 以及任何七层协议?
作者:赵化冰,唐阳
作为云原生领域中一个人气非常高的开源项目, Istio 目前已经基本成为了 Service Mesh 的事实标准。腾讯云上也提供了基于 Istio 进行增强,和 Istio API 完全兼容的 Service Mesh 管理服务 TCM ,以帮助我们的用户以较小的迁移成本和维护代价快速利用到 Service Mesh 提供的流量管理和服务治理能力。
感谢大家对腾讯云原生公众号一直以来的支持!
2022年我们会继续产出好的技术内容,
致力于云原生、容器等新技术
被越来越多的企业和开发者接纳和使用。
宠粉福利
一键三连本文,并将本文转发到朋友圈,截图发到【腾讯云原生】公众号后台,随机抽取5名幸运鹅送Q弹可爱短鹅一个!活动截止至12月31日中午12点。
重磅介绍
【燎原社】推出了专业而又系统的线下云原生技术实战营,需要系统化深入学习的同学,可扫码报名云原生技术实战营课程,腾讯云技术专家现场教学,3天搞定云原生容器化改造过程中的实际问题,扫码一键直达:
往期精选推荐
点个“在看”每天学习最新技术