首页
学习
活动
专区
工具
TVP
发布

腾讯云原生团队

专栏作者
547
文章
758239
阅读量
194
订阅数
深度复盘-重启 etcd 引发的异常
唐聪、王超凡,腾讯云原生产品中心技术专家,负责腾讯云大规模 TKE 集群和 etcd 控制面稳定性、性能和成本优化工作。 王子勇,腾讯云专家级工程师, 腾讯云计算产品技术服务专家团队负责人。 概况 作为当前中国广泛使用的云视频会议产品,腾讯会议已服务超过 3 亿用户,能高并发支撑千万级用户同时开会。腾讯会议数百万核心服务都部署在腾讯云 TKE 上,通过全球多地域多集群部署实现高可用容灾。在去年用户使用最高峰期间,为了支撑更大规模的并发在线会议的人数,腾讯会议与 TKE 等各团队进行了一轮新的扩容。 然而,在
腾讯云原生
2023-02-13
1.3K0
【容器8月报】降本增效产品化特性重磅发布,多项新功能开放体验中
TKE 集群 【新特性】上线 SecurityGroupPolicy 增强组件,支持为策略匹配的 Pod 绑定安全组,以控制 Pod 的出入站网络流量。 【新特性】对接 CAM OIDC IdP,支持业务 Pod 使用 Service Account Token 访问如 CVM、VPC 等云资源,同时确保身份验证的安全性。 TKE 原生节点 【新特性】上线 Pod 原地升降配能力,支持在不重启 Pod 的情况下直接修改 CPU、内存的 Request/limit 值,适用于流量突发、业务降本场景。 【新特
腾讯云原生
2022-09-09
4771
成本最高降低70%,腾讯大规模业务集群的云原生成本优化实践!
唐聪,腾讯云容器技术专家,极客时间专栏《etcd实战课》作者,开源项目kstone和crane内部雏形版 founder,etcd活跃贡献者,主要负责腾讯云大规模k8s和etcd平台稳定性和性能优化、业务集群成本优化、有状态服务容器化等产品研发设计工作。 背景 2021年下半年以来,在新冠疫情和互联网政策的冲击之下,各大互联网公司都在进行降本增效。降本增效的一大核心手段就是优化计算资源成本,本文将以腾讯某内部 Kubernetes/TKE 业务为案例,详细阐述如何从 0到1(成本数据采集与分析、优化措施、行
腾讯云原生
2022-07-01
2.5K0
618倒计时!云上盛惠,全年底价!
blocks|key|764325|text||type|atomic|depth|inlineStyleRanges|entityRanges|offset|length|data|entityMap|IMAGE|mutability|IMMUTABLE|imageUrl|https://ask.qcloudimg.com/http-save/yehe-6886083/1bd5566942e980ac544bad4d5899dd9f.jpeg|imageAlt^0|0|1|0^^$0|@$1|2|3|4|
腾讯云原生
2022-06-29
5990
Aeraki Mesh正式成为CNCF沙箱项目,腾讯云携伙伴加速服务网格成熟商用
6月,由腾讯云主导,联合百度、灵雀云、腾讯音乐、滴滴、政采云等多家合作伙伴发起的服务网格开源项目 Aeraki Mesh 通过了全球顶级开源基金会云原生计算基金会(CNCF)技术监督委员会评定,正式成为CNCF 沙箱项目。这意味着 Aeraki Mesh 得到了云原生开源社区的认可,而且加入 CNCF 也保证了项目的中立和开源开放,为 Aeraki Mesh 在云原生生态系统的进一步发展迈出了坚定的一步。 Aeraki Mesh 加入 CNCF 的这个时间点,恰好在 Istio 宣布将 Istio 捐赠给
腾讯云原生
2022-06-20
6430
最佳案例 | QQ 相册云原生容器化之路
吕朋钊,腾讯业务运维高级工程师,曾负责 QQ 相册、小世界业务的存储接入层运维,现负责 AI 业务的运维。 背景 QQ 相册是 QQ 产品中为用户提供图片存储,分享等功能的成熟产品,自上线以来,一直为用户提供稳定快速的图片上传和下载服务。作为社交业务组内第一个上 TKE 的平台,相册在过去一年多时间里总结出了一套适合自身的 TKE 上云实践方案。 服务场景 自相册全面改造上云之后,新的架构如下: 问题 随着相册各模块已基本实现容器化,也暴露出了不少使用上的问题。 资源利用率提升与 CICD 优化 1.
腾讯云原生
2022-05-06
5.4K1
K8s 如何提供更高效稳定的编排能力?K8s Watch 实现机制浅析
王成,腾讯云研发工程师,Kubernetes member,从事数据库产品容器化、资源管控等工作,关注 Kubernetes、Go、云原生领域。 目录 概述 从 HTTP 说起    2.1 Content-Length     2.2 Chunked Transfer Encoding     2.3 HTTP/2 APIServer 启动 ETCD 资源封装  客户端 Watch 实现 服务端 Watch 实现 小结 1. 概述 进入 K8s 的世界,会发现几乎所有对象都被抽象为了资源(Resourc
腾讯云原生
2022-05-05
2K0
Kubernetes 服务部署最佳实践(一)
作者陈鹏(roc),腾讯工程师,负责腾讯云TKE的售中、售后的技术支持,根据客户需求输出合理技术方案与最佳实践,为客户业务保驾护航。 引言 业务容器化后,如何将其部署在 K8S 上? 图片来自网络 如果仅仅是将它跑起来,很简单,但如果是上生产,我们有许多地方是需要结合业务场景和部署环境进行方案选型和配置调优的。 比如,如何设置容器的 Request 与 Limit、如何让部署的服务做到高可用、如何配置健康检查、如何进行弹性伸缩、如何更好的进行资源调度、如何选择持久化存储、如何对外暴露服务等。 对于这一
腾讯云原生
2022-04-14
9940
年初一,虎年大吉,腾讯云原生给大家拜年啦!
entityMap|type|IMAGE|mutability|IMMUTABLE|data|imageUrl|https://ask.qcloudimg.com/http-save/6886083/d72d04afac99bc53f747aba31f3faf9c.png|imageAlt|blocks|key|5fugk|text||atomic|depth|inlineStyleRanges|entityRanges|offset|length^0|0|1|0^^$0|@$1|2|3|4|5|$6|7|
腾讯云原生
2022-02-08
2210
除夕,腾讯云原生与你一起温暖守岁
entityMap|type|IMAGE|mutability|IMMUTABLE|data|imageUrl|https://ask.qcloudimg.com/http-save/6886083/e01de64f2be93073c78d273a6869421f.png|imageAlt|blocks|key|9n7ut|text||atomic|depth|inlineStyleRanges|entityRanges|offset|length^0|0|1|0^^$0|@$1|2|3|4|5|$6|7|
腾讯云原生
2022-02-08
3870
智能 Request 推荐,K8s 资源利用率提升 252%
王孝威,FinOps 认证从业者,腾讯云容器服务产品经理,热衷于为客户提供高效的 Kubernetes 使用方式,为客户极致降本增效服务。 余宇飞,FinOps 认证从业者,腾讯云专家工程师,从事云原生可观测性、资源管理、降本增效产品的开发。 资源利用率为何都如此之低? 虽然 Kubernetes 可以有效的提升业务编排能力和资源利用率,但如果没有额外的能力支撑,提升的能力十分有限,根据 TKE 团队之前统计的数据:Kubernetes 降本增效标准指南| 容器化计算资源利用率现象剖析,如下图所示:TKE
腾讯云原生
2021-11-26
3.1K1
谷歌每年节省上亿美金,资源利用率高达60%,用的技术有多厉害!
田奇,腾讯高级工程师,专注大规模在离线混部,分布式资源管理调度,熟悉Kubernetes,关注云原生大数据、AI。 导语 什么是在离线混部 随着微服务、大数据、人工智能的不断发展,为了满足业务需求,企业的 IT 环境通常运行两大类服务,一类是在线服务,一类是离线作业。 在线服务:往往长时间运行,服务流量存在周期特性,整体资源使用率不高,但是对服务 SLA 却有着极高的要求,如网页搜索服务、电商交易服务等。 离线作业:往往是资源密集型服务,但其可以容忍较高的时延、失败任务重启,如大数据分析服务、机器学习训
腾讯云原生
2021-08-27
1.9K0
kubernetes 降本增效标准指南|ProphetPilot:容器智能成本管理引擎
田奇,腾讯云高级工程师,专注大规模离在线混部,弹性伸缩,云原生成本优化,熟悉Kubernetes,关注云原生大数据、AI。 王孝威,腾讯云容器产品经理,热衷于为客户提供高效的 Kubernetes 使用方式,为客户极致降本增效服务。 前言 随着 Kubernetes 的普及,企业已经普遍接受了容器,正在向云原生演进。但是当前的 Kubernetes 只解决云原生的第一步(Day 1),就是利用容器编排调度和声明式API等,来解决资源获取、应用部署、高可用容灾、基础运维等难题。但是目前采纳 Kubernet
腾讯云原生
2021-07-27
1.2K0
SuperEdge 云边隧道新特性:从云端SSH运维边缘节点
李腾飞,腾讯容器技术研发工程师,腾讯云TKE后台研发,SuperEdge核心开发成员。 王冬,腾讯云TKE后台研发工程师,专注容器云原生领域,SuperEdge 核心开发人员,现负责腾讯云边缘容器TKE Edge私有化相关工作。 背景 在边缘集群的场景下边缘节点分布在不同的区域,且边缘节点和云端之间是单向网络,边缘节点可以访问云端节点,云端节点无法直接访问边缘节点,给边缘节点的运维带来很大不便,如果可以从云端SSH登录到边缘节点可以简化节点的运维工作。针对这一需求,SuperEdge[1] 项目扩展了
腾讯云原生
2021-06-30
8630
案例 | 腾讯广告 AMS 的容器化之路
张煜,15年加入腾讯并从事腾讯广告维护工作。20年开始引导腾讯广告技术团队接入公司的TKEx-teg,从业务的日常痛点并结合腾讯云原生特性来完善腾讯广告自有的容器化解决方案。 项目背景 腾讯广告承载了整个腾讯的广告流量,并且接入了外部联盟的请求,在所有流量日益增大的场景下,流量突增后如何快速调配资源甚至自动调度,都成为了广告团队所需要考虑的问题。尤其是今年整体广告架构(投放、播放)的条带化容灾优化,对于按需分配资源、按区域分配资源等功能都有着更强的依赖。在广告内部,播放流系统承载了整个广告播出的功能,这
腾讯云原生
2021-06-25
1.5K0
一篇文章带你搞懂 etcd 3.5 的核心特性
唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者,主要负责腾讯云大规模k8s/etcd平台、有状态服务容器化、在离线混部等产品研发设计工作。 etcd 3.5 发布 美东时间2021年6月15号18点,继 etcd 3.4 版本发布近两年之后,etcd 社区官宣发布了3.5 稳定版本,其主要贡献者来自 Google、AWS、Tencent、Red Hat、ByteDance、IBM 等公司的开发者。etcd 3.5 版本的发布,将极大提升开发者体验、更快、更稳的支撑 kube
腾讯云原生
2021-06-17
1.7K0
Istio最佳实践系列:如何实现方法级调用跟踪?
赵化冰,腾讯云高级工程师,Istio Member,ServiceMesher 管理委员,Istio 项目贡献者,热衷于开源、网络和云计算。目前主要从事服务网格的开源和研发工作。 引言 TCM(Tencent Cloud Mesh)是腾讯云上提供的基于Istio 进行增强,和 Istio API 完全兼容的 Service Mesh 托管服务,可以帮助用户以较小的迁移成本和维护代价快速利用到 Service Mesh 提供的流量管理和服务治理能力。本系列文章将介绍 TCM 上的最佳实践,本文将介绍如何利用
腾讯云原生
2021-04-12
1.1K0
kubernetes 降本增效标准指南| 资源利用率提升工具大全
王孝威,腾讯云容器产品经理,热衷于为客户提供高效的 Kubernetes 使用方式,为客户极致降本增效服务。 晏子怡,腾讯云容器产品经理,在Kubernetes 弹性伸缩、资源高效利用领域有丰富的实战经验。 背景 公有云的发展为业务的稳定性、可拓展性、便利性带来了极大帮助。这种用租代替买、并且提供完善的技术支持和保障的服务,理应为业务带来降本增效的效果。但实际上业务上云并不意味着成本一定减少,还需适配云上业务的应用开发、架构设计、管理运维、合理使用等多方面解决方案,才能真正助力业务的降本增效。在《Ku
腾讯云原生
2021-04-09
2.7K1
从 lite-apiserver 看 SuperEdge 边缘节点自治
程振东,腾讯高级工程师,腾讯云TKE后台研发,负责TKE Edge的功能开发,SuperEdge核心开发成员,lite-apiserver的主要作者之一。 引言 在 SuperEdge 0.2.0版本中,lite-apiserver 进行了重大的架构升级和功能增强。本文将从 lite-apiserver 实现及其与其它 SuperEdge 组件协同的角度,分析 SuperEdge 的边缘自治能力,给大家的研究和选型提供参考。 边缘节点自治 在云边协同的边缘计算场景中,边缘节点通过公网与云端连接。边缘节点
腾讯云原生
2021-04-07
7230
一文读懂 SuperEdge 分布式健康检查(云端)
杜杨浩,腾讯云高级工程师,热衷于开源、容器和Kubernetes。目前主要从事镜像仓库、Kubernetes集群高可用&备份还原,以及边缘计算相关研发工作。 前言 SuperEdge 介绍 SuperEdge 是基于原生 Kubernetes 的边缘容器管理系统。该系统把云原生能力扩展到边缘侧,很好的实现了云端对边缘端的管理和控制,极大简化了应用从云端部署到边缘端的过程。同时 SuperEdge 设计了分布式健康检查机制规避了云边网络不稳定造成的大量pod迁移和重建,保证了服务的稳定。 SuperEdge
腾讯云原生
2021-03-23
9200
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档