首页
学习
活动
专区
工具
TVP
发布

腾讯云容器服务团队的专栏

专栏作者
36
文章
188648
阅读量
174
订阅数
一次ServiceAccount导致的apiserver雪崩案例分析
某业务使用k8s1.12版本的集群,集群内有上千个node,某天在master有一波突发请求后,突然变为不可用状态,集群内大量组件访问master超时,业务重启master组件后仍未恢复。
shawwang
2021-07-06
1.1K0
Improving GPU Utilization in Kubernetes
目前,Kubernetes通过Device Plugin和Extended Resource机制支持在集群中使用GPU等异构资源,但官方的实现限制了只能以独占的方式使用资源,即资源分配的最小粒度是一张卡。在深度学习领域模型推理等场景下,一个客观存在的事实是,上层应用往往无法跑满独占的整卡资源,这就导致了资源的闲置和浪费,考虑到GPU较高的使用成本,提升其利用率就成为了用户的刚需。
jimmyhzhang
2020-12-29
1.1K0
Kubernetes TLS bootstrapping流程分析
细节参见官方文档:https://kubernetes.io/docs/reference/command-line-tools-reference/kubelet-tls-bootstrapping/
shawwang
2020-07-06
2K0
Apache Flink on Kubernetes运行模式分析
Apache Flink是一个分布式流处理引擎,它提供了丰富且易用的API来处理有状态的流处理应用,并且在支持容错的前提下,高效、大规模的运行此类应用。通过支持事件时间(event-time)、计算状态(state)以及恰好一次(exactly-once)的容错保证,Flink迅速被很多公司采纳,成为了新一代的流计算处理引擎。2020年2月11日,社区发布了Flink 1.10.0版本, 该版本对性能和稳定性做了很大的提升,同时引入了native Kubernetes的特性。对于Flink的下一个稳定版本,社区在2020年4月底冻结新特性的合入,预计在2020年5-6月会推出Flink1.11,该版本重点关注新特性的合入(如FLIP-105,FLIP-115,FLIP-27等)与内核运行时的功能增强,以扩展Flink的使用场景和应对更复杂的应用逻辑。。
yujunwang
2020-05-29
2.1K0
重启导致etcd数据不一致的bug分析
近日,腾讯云TKE团队的工程师在做混沌测试的过程中,定位并解决了一个存在3年之久的etcd3数据一致性bug。
于广游garyyu
2020-03-16
2.6K0
关注专栏作者,随时接收最新技术干货
升级集群导致ETCD数据不一致/毁坏案例分析
近期我们在测试环境升级ETCD集群(3.2升级到3.3)的时候,遇到了一些奇怪现象。当集群升级完后,收到了测试同学反馈集群出现各种BUG了:
tangcong
2020-03-16
2.8K1
TKE基于Helm的应用管理实践
Author: Jimmy Zhang (张浩) K8s中使用传统方式部署应用的挑战 [应用部署示例] 编辑,部署和更新应用的众多资源描述文件心智负担较重 没有统一的视图来看待一个应用的相关资源 缺乏有效机制来管理应用的整个生命周期 无法管理应用的依赖 难以共享和复用现有的应用 什么是Helm Helm是一个应用于K8s的包管理器,类似于YUM或者APT Helm将原生应用程序涉及到的众多K8s资源对象打包成一个所谓的Chart,以此实现统一的管理 对于应用发布者而言,可以通过Helm来打包应用,管理应用依
jimmyhzhang
2019-07-05
1.1K0
腾讯IEG游戏营销活动 腾讯云k8s实践
K8S,是Kubernetes(舵手)的简称,是Google在2014年6月开源的一个基于容器技术的分布式集群管理系统。后google捐赠给Cloud Native Computing Foundation(现属Linux基金会)来使用。
腾讯云容器服务团队
2019-05-16
14.6K0
使用腾讯云容器服务TKE VS 自建k8s 集群
TKE(Tencent Kubernetes Engine) 是腾讯云提供的容器服务PAAS 平台,基于kubernetes, 集成了腾讯云vpc网络,负载均衡,存储等IAAS 资源,提供容器调度、日志、监控、镜像仓库,Helm编排,自动弹性伸缩,微服务治理,DevOps 等功能,为客户提供完整的企业级容器服务。
caryguo
2019-04-11
6.3K10
K8s Network Policy Controller之Kube-router性能测试
在k8s集群中部署大量的Nginx服务,通过ApacheBench工具压测固定的一个服务,对比开启和不开启kube-router场景下的QPS,衡量kube-router带来的性能损耗。
颜卫
2018-08-09
1.2K0
K8s Network Policy Controller之Kube-router功能介绍
Network Policy是k8s提供的一种资源,用于定义基于pod的网络隔离策略。它描述了一组pod是否可以与其它组pod,以及其它network endpoints进行通信。
颜卫
2018-07-31
1.4K0
腾讯云容器服务TKE(原CCS),为用户提供 Kubernetes1.10 服务
腾讯云容器服务是首批通过Kubernetes一次性认证的服务商,本次腾讯云容器服务再次支持kubernetes 1.10,并再次通过Kubernetes一次性认证。如需可提交工单申请kubernetes1.10版本
腾讯云容器服务团队
2018-06-21
2.3K0
K8S线上实战课堂第二期--入门Kubernetes的Deployment/Pod/Service
腾讯云K8S线上实战课堂,从0到1,结合方法论和实操演示,和大家一起快速入门和学习K8S和容器技术。今天推出第二期 从Hello World 了解Kubernetes的Pod、Service、Deployment。
腾讯云容器服务团队
2018-04-11
1.6K0
燃爆整个2018年的K8S免费培训来了!
4月4日起,腾讯云容器团队将于每周三,推出从0到1—K8S技术培训,K8S线上实战课堂!
腾讯云容器服务团队
2018-04-03
3.2K6
腾讯云容器服务集群中安装 dashboard ui
目前 CCS 控制台暂时不支持 Job, Pod, CronJob 等对象的展示。有通过 web 界面查看这些类型对象的需求的话,可以自行安装 k8s dashboard UI 来实现。
腾讯云容器服务团队
2018-02-28
4.5K3
使用腾讯云容器服务来构建简单web service
本文将介绍使用nginx和php来构建简单web service,核心在于如何配置nginx的upstream,使得nginx能够与后端服务通信。
腾讯云容器服务团队
2018-01-15
4.2K1
腾讯云容器网络 vpc 对比 vxlan 性能测试
真的志国
2017-12-05
5.6K0
献给容器爱好者们的一张藏宝图
本文介绍了CNUTCon全球运维技术大会将于2017年9月10-11日在上海光大会展中心酒店开启,腾讯云受邀参会,并将以演讲和展位的方式,向众多技术极客们,展示腾讯云容器服务和无服务器云函数产品以及相关案例,并将现场展示最新架构和原理和实操演示环境。此外,腾讯云容器服务提供以容器为核心的解决方案,解决用户开发、测试及运维过程中的问题,降低企业成本,提升效率,完全兼容原生Kubernetes全能力, 扩展了腾讯云的CLB、CBS、VPC等插件,以腾讯云私有网络为基础,实现高可靠、高性能的网络方案。同时,腾讯云基于Kubernetes的容器服务架构以及多维度监控体系,能够实现主集群和分支集群的统筹管理,使得应用开发、部署和运维全面简化,帮助用户更好地解决运维过程中的问题。
腾讯云容器服务团队
2017-09-07
1.8K0
基于 Kubernetes 的 ConfigMap 实现的腾讯云配置文件管理功能介绍
腾讯云容器服务团队
2017-09-06
3.3K0
8 月最新基于 kubernetes 的应用编排实践
腾讯云容器服务团队
2017-08-24
3.5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档