首页
学习
活动
专区
工具
TVP
发布

腾讯云原生团队

专栏作者
547
文章
755685
阅读量
192
订阅数
年终大禧 | 腾讯云 Crane 国内首批通过云原生混部技术评估
2023 年 1 月 9 日云原生产业联盟(CNIA)举办 2022 年度线上年会,中国信通院云大所云计算发布了云原生系列测评成果,腾讯云主导开源的云原生成本优化项目 Crane 首批通过“云原生混部”项目评估。 Crane 是国内第一个基于云原生技术的成本优化开源项目,遵循 FinOps 标准,旨在为云原生用户提供云成本优化一站式解决方案。 技术方面,Crane 基于两级调度能力,实现高优先级延迟敏感业务和低优先级高吞吐业务在相同节点上的混合运行。 一级调度能力,确保应用的高效调度,实现真正的“用多少占多
腾讯云原生
2023-01-30
1.2K0
成本最高降低70%,腾讯大规模业务集群的云原生成本优化实践!
唐聪,腾讯云容器技术专家,极客时间专栏《etcd实战课》作者,开源项目kstone和crane内部雏形版 founder,etcd活跃贡献者,主要负责腾讯云大规模k8s和etcd平台稳定性和性能优化、业务集群成本优化、有状态服务容器化等产品研发设计工作。 背景 2021年下半年以来,在新冠疫情和互联网政策的冲击之下,各大互联网公司都在进行降本增效。降本增效的一大核心手段就是优化计算资源成本,本文将以腾讯某内部 Kubernetes/TKE 业务为案例,详细阐述如何从 0到1(成本数据采集与分析、优化措施、行
腾讯云原生
2022-07-01
2.5K0
万级K8s集群背后etcd稳定性及性能优化实践
唐聪, 腾讯云高级工程师, etcd活跃贡献者, 主要负责腾讯云万级K8s集群和内部业务的公共etcd平台以及Serverless产品研发设计工作。 背景与挑战 随着腾讯自研上云及公有云用户的迅速增长,一方面,腾讯云容器服务TKE服务数量和核数大幅增长, 另一方面我们提供的容器服务类型(TKE托管及独立集群、EKS弹性集群、edge边缘计算集群、mesh服务网格、serverless knative)也越来越丰富。各类容器服务类型背后的核心都是K8s,K8s核心的存储etcd又统一由我们基于K8s构建的et
腾讯云原生
2022-04-14
1.2K0
比 Facebook、Twitter 在瞬息万变的市场中保持“稳定”迭代更厉害的秘密-全自动渐进式交付
作者王炜,CODING DevOps 后端开发工程师多年研发经验,云原生、DevOps、Kubernetes 资深爱好者,Servicemesher 服务网格中文社区成员。获得 Kubernetes CKA、CKAD 认证。 1. 开篇 如果让你主导一款千万、甚至亿级用户产品的功能迭代,你会怎么做?你需要面对的挑战可能来自于: 商业战略的变化带来新的产品诉求,而产品的任何改动哪怕仅是界面调整,都将面临无数存量用户的挑战 这时候,作为产品负责人,你会选择稳定压倒一切?还是自我革新,继续追求用户和市场的价值呢?
腾讯云原生
2022-04-14
4440
云原生的弹性 AI 训练系列之三:借助弹性伸缩的 Jupyter Notebook,大幅提高 GPU 利用率
高策,腾讯高级工程师,Kubeflow 训练和自动机器学习工作组 Tech Lead,负责腾讯云 TKE 在 AI 场景的产品研发和支持工作。 Jupyter Notebooks 在 Kubernetes 上部署往往需要绑定一张 GPU,而大多数时候 GPU 并没有被使用,因此利用率低下。为了解决这一问题,我们开源了 elastic-jupyter-operator[1],将占用 GPU 的 Kernel 组件单独部署,在长期空闲的情况下自动回收,释放占用的 GPU。这篇文章主要介绍了这一开源项目的使用方式
腾讯云原生
2022-04-14
1K0
使用 Istio CNI 支持强安全 TKE Stack 集群的服务网格流量捕获
陈计节,企业应用云原生架构师,在腾讯企业 IT 负责云原生应用治理产品的设计与研发工作,主要研究利用容器集群和服务网格等云原生实践模式降低微服务开发与治理门槛并提升运营效率。 摘要 给需要快速解决问题的集群管理员:  在 TKE Stack 中正确安装 Istio CNI 有两种方式:如果你的 TKE Stack 集群所使用 Galaxy 版本可以支持 cniVersion 0.3.1,请以默认的方式安装 Istio CNI;否则请使用以“网卡插件”的方式安装 Istio CNI,并在创建 Pod 时指定使
腾讯云原生
2022-03-10
5110
腾讯云 CIF 工程效能峰会,10 月 19 - 20 日震撼来袭!
近年来,依托于云计算的飞速发展,腾讯云云产品更新迅猛,云原生生态构建初具规模,越来越多的企业也开始寻求与深入数字化转型之路。但在摸索与实践中,企业往往会进入“伪上云”的误区。除了单纯的服务器上云,企业更需要在组织方式、技术架构上进行更深刻的变革,才能充分享受云原生带来的种种便利。 腾讯云 CIF 工程效能峰会由腾讯云 CODING 主办,以“云上开发,化繁为简”为主题,聚焦云原生加持下的研发效能升级,与数字化风潮下的企业转型实践。腾讯云副总裁肖衡、中国信息通信研究院云大所副所长栗蔚、腾讯 PCG 效能
腾讯云原生
2021-10-11
6530
如何高效掌控K8s资源变化?K8s Informer实现机制浅析
王成,腾讯云研发工程师,Kubernetes contributor,从事数据库产品容器化、资源管控等工作,关注 Kubernetes、Go、云原生领域。 概述 进入 K8s 的世界,会发现有很多的 Controller,它们都是为了完成某类资源(如 pod 是通过 DeploymentController, ReplicaSetController 进行管理)的调谐,目标是保持用户期望的状态。 K8s 中有几十种类型的资源,如何能让 K8s 内部以及外部用户方便、高效的获取某类资源的变化,就是本文 
腾讯云原生
2021-09-15
1.2K2
7月23日 | 第三届腾讯运维技术开放日,一起拥抱云原生
你以为互联网人的极致是 996 吗?其实,有这么一批人是007! 7x24 小时全天超长“待机”,全年午休。因此,把7月24日定为他们的专属节日——这就是运维。 他们要保障系统稳定、维护业务正常运行;他们要快速响应、争分夺秒,化危机为无形;他们的每一分每一秒都不能松懈! 为致敬运维人,打造开放的运维技术生态,7月23日,腾讯云、TEG 技术工程及 CODING 联合,举办第三届腾讯运维技术开放日直播活动。 第三届腾讯运维技术开放日,将邀请腾讯云高级工程师、TEG 持续部署产品总监及 CODING 高级
腾讯云原生
2021-07-20
3630
一篇文章带你搞懂 etcd 3.5 的核心特性
唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者,主要负责腾讯云大规模k8s/etcd平台、有状态服务容器化、在离线混部等产品研发设计工作。 etcd 3.5 发布 美东时间2021年6月15号18点,继 etcd 3.4 版本发布近两年之后,etcd 社区官宣发布了3.5 稳定版本,其主要贡献者来自 Google、AWS、Tencent、Red Hat、ByteDance、IBM 等公司的开发者。etcd 3.5 版本的发布,将极大提升开发者体验、更快、更稳的支撑 kube
腾讯云原生
2021-06-17
1.7K0
使用 Velero 跨云平台迁移集群资源到 TKE
李全江(jokey),腾讯云工程师,热衷于云原生领域。目前主要负责腾讯云 TKE 的售中、售后的技术支持,根据客户需求输出合理技术方案与最佳实践。 概述 Velero[1] 是一个非常强大的开源工具,可以安全地备份和还原,执行灾难恢复以及迁移Kubernetes群集资源和持久卷,可以在 TKE 平台上使用 Velero 备份、还原和迁移集群资源,关于如何使用请参阅 使用对象存储 COS 作为 Velero 存储实现集群资源备份和还原[2] 和 在 TKE 中使用 Velero 迁移复制集群资源,本文将介绍
腾讯云原生
2021-03-29
9510
在腾讯云容器服务 TKE 中利用 HPA 实现业务的弹性伸缩
jokey,腾讯云容器产品工程师,热衷于云原生领域。目前主要负责腾讯云TKE 的售中、售后的技术支持,根据客户需求输出合理技术方案与最佳实践。 概述 Kubernetes Pod 水平自动扩缩(Horizontal Pod Autoscaler,以下简称 HPA)可以基于 CPU 利用率、内存利用率和其他自定义的度量指标自动扩缩 Pod 的副本数量,以使得工作负载服务的整体度量水平与用户所设定的目标值匹配。本文将介绍和使用腾讯云容器服务 TKE 的 HPA 功能实现 Pod 自动水平扩缩容。 使用场景 H
腾讯云原生
2020-12-03
2.6K0
一篇读懂Kubernetes Scheduler扩展功能
作者杜杨浩,腾讯云高级工程师,热衷于开源、容器和Kubernetes。目前主要从事镜像仓库以及云原生架构相关研发工作。 前言 Scheduler是Kubernetes组件中功能&逻辑相对单一&简单的模块,它主要的作用是:watch kube-apiserver,监听PodSpec.NodeName为空的pod,并利用预选和优选算法为该pod选择一个最佳的调度节点,最终将pod与该节点进行绑定,使pod调度在该节点上运行。 展开上述调用流程中的scheduler部分,内部细节调用(参考Kubernet
腾讯云原生
2020-11-02
2.4K0
“有你有我开源节”腾讯开源沙龙专场来啦!
开源,是企业与IT开发人员最常提到的词汇之一。根据工信部信通院《2019年开源产业白皮书》的数据显示,在国内,已应用开源技术的企业占比达到86.7%,有计划应用开源技术的企业占比10.6%,开源技术已经被企业普遍接受。 开源技术带给企业与开发人员的好处是多种多样的。白皮书调查指出,企业对技术成熟度的关注最高,达到68.7%;其次,46.3%的企业在选择开源技术时会考虑功能丰富程度。此外,还有43.3%的企业因缩短应用部署时间而选择开源技术。 借着中国首座开源孵化基地“深圳·国际开源谷”正式落户福田区
腾讯云原生
2020-10-14
3560
号外号外!中国 DevOps 社区 & CODING 深圳第九届Meetup 来啦!
号外号外!中国 DevOps 社区 & CODING 深圳第九届Meetup 来啦! 本次以「DevOps 转型与实践」为主题的技术沙龙活动,由腾讯云旗下一站式 DevOps 开发平台 CODING 和中国 DevOps 社区主办,邀请了四位来自世界 500 强或国内外知名企业的技术大咖,共同探讨在 DevOps 的大潮流中,各公司如何攻克常见的企业痼疾根源,实现转型与落地实践 DevOps,提高研发效能。 海报详情及报名方式如下图 腾讯云原生作为本次活动的深度合作伙伴,为大家争取了十张免
腾讯云原生
2020-09-09
6370
持续部署入门:基于 Kubernetes 实现蓝绿发布
前言 软件世界比以往任何时候都更快。为了保持竞争力,需要尽快推出新的软件版本,而不会中断活跃用户访问,影响用户体验。越来越多企业已将其应用迁移到 Kubernetes。 在 Kubernetes 中有几种不同的方式发布应用,所以为了让应用在升级期间依然平稳提供服务,选择一个正确的发布策略就非常重要了,本篇文章将讲解在 Kubernetes 使用蓝绿更新的方式更新镜像。 原理 蓝绿发布是版本 1 与版本 2 会同时存在,通过控制 Service 来决定使用具体哪一个版本,也称为红黑部署。蓝绿发布与滚动更新不
腾讯云原生
2020-09-08
4680
持续部署入门:基于 Kubernetes 实现滚动发布
前言 软件世界比以往任何时候都更快。为了保持竞争力,需要尽快推出新的软件版本,而不会中断活跃用户访问,影响用户体验。越来越多企业已将其应用迁移到 Kubernetes。 在 Kubernetes 中有几种不同的方式发布应用,所以为了让应用在升级期间依然平稳提供服务,选择一个正确的发布策略就非常重要了,本篇文章将讲解如何在 Kubernetes 使用滚动更新的方式更新镜像。 原理 策略定义为 RollingUpdate 的 Deployment。滚动更新通过逐个替换实例来逐步部署新版本的应用,直到所有实例都
腾讯云原生
2020-09-07
4090
如何扩展单个Prometheus实现近万Kubernetes集群监控?
作者黄雷,腾讯云工程师,曾负责构建腾讯云云监控新一代多维业务监控系统,擅长大规模分布式监控系统设计,对golang后台项目架构设计有较深理解,后加入TKE团队,致力于研究Kubernetes相关运维技术,拥有多年Kubernetes集群联邦运维管理经验,目前在团队主要负责大规模集群联邦可观测性提升,主导研发了腾讯云万级Kubernetes集群监控告警系统,智能巡检与风险探测系统。 引言 TKE团队负责公有云,私有云场景下近万个集群,数百万核节点的运维管理工作。为了监控规模如此庞大的集群联邦,TKE团队在原
腾讯云原生
2020-08-17
1.7K0
揭秘!containerd 镜像文件丢失问题,竟是镜像生成惹得祸
作者李志宇,腾讯云后台开发工程师,日常负责集群节点和运行时相关的工作,熟悉 containerd、docker、runc 等运行时组件。近期在为某位客户提供技术支持过程中,遇到了 containerd 镜像丢失文件问题,经过一系列分析、推断、复现、排查,最终成功找到根因并给出解决方案。现将整个详细处理过程整理成文分享出来,希望能够为大家提供一个有价值的问题处理思路以及帮助大家更好地理解相关原理。
腾讯云原生
2020-05-22
1.9K0
三年之久的 etcd3 数据不一致 bug 分析
“ etcd 作为 Kubernetes 集群的元数据存储,是被业界广泛使用的强一致性 KV 存储,但近日被挖掘出一个存在 3 年之久的数据不一致 bug——client 写入后无法在异常节点读取到数据,即数据丢失。本文介绍了我们是如何从问题分析、大胆猜测、严谨验证、排除、工程化复现,从 raft 到 boltdb,从源码定制再到 chaos monkey,一步步定位并解决 etcd 数据不一致 bug 的详细流程,并将解决方案提交给社区,移植到 etcd 3.4/3.3 生产环境分支。希望通过本文,能够揭开 etcd 的神秘面纱,让大家对 etcd 的原理和问题定位有一个较为深入的了解。
腾讯云原生
2020-05-06
3.3K2
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档