鲍永成
京东商城基础架构部技术总监
京东技术11.11基础架构峰会讲师
2013年加入京东,负责京东容器集群平台研发,带领团队完成京东容器大规模落地战略项目,有效承载京东全部业务系统以及数据库和中间件系统,特别在大促期间秒级Scale UP应对高峰流量经验丰富。目前聚焦在京东容器集群 JDOS 2.0 阿基米德 以及京东敏捷智能数据中心的研发。在分布式、虚拟化、容器、数据中心建设有丰富的实践经验。
01
Q:您加入京东之后主要负责过哪些研发工作?
A:加入京东之后,我一直从事的主要核心工作是容器。容器是运行的载体,这个载体之上包含广泛的支撑系统。比如像对整个数据中心的管理、内核、操作系统、日志、监控、Docker、Openstack和一些分布式的存储等领域,还包括用户业务上线完整流程等。
2
Q:您对容器研究的重点是什么呢?有哪些成果?
A:主要是Linux操作系统内核。在一些技术交流的时候我也会经常表达,做容器不管是用Docker还是用Openstack,这些都是一些管理软件,都是在管理容器里的内容。
但真正在容器运行中起到心脏作用的还是Linux内核,内核决定了容器的性能、稳定性。容器技术本质上是Linux 内核技术。
3
Q:您在内核方面有哪些成果?
A:关于成果,其实在这次京东“11·11全球好物节”中,我们基于内核升级了CPU调度算法,实现了无感知动态调配基础设施资源。
解释来说就是每一千台服务器就能提供两千台服务器的计算能力,极大的降低了公司服务器的采购与运维成本,优化后的CPU平均使用率已达到国内同行业的领先水平
除此之外,我们还能从代码级别帮助用户解决业务运行中产生的问题。我们在内核中布置了很多埋点和钩子,能直接监控用户业务在容器运行中的全部行为,分析出是什么原因导致容器性能变差。
这些我们都能在应用的执行指令集层面做计量,很容易帮助研发人员定位总结问题,以及在底层实现规避这些问题。
4
Q:在“11·11”大促备战的研发工作中,有什么有趣的事情吗?
A:我们在结合调度资源时发现了一件有趣的事情:能节省数据中心的电力消耗。我们实验了两个物理POD,根据服务器的CPU使用率、IO、主要应用负载等多个参考坐标对机器CPU自动降频,结果显示一共能节省17%的电力。
虽然还处于试验阶段,但基于目前已经验证成熟的技术能力,2018年会推广至京东所有的机房,实现节能减排。
5
Q:您对Kubernetes和OpenStack都深入研究,您怎么看待它们?
A:OpenStack现在已经非常成熟了,但在使用上稍显滞重,Kubernetes现在的阶段就相当于OpenStack刚出世的头两年,用起来更轻捷而且发展的很快。
使用Kubernetes后都会发现,它是不能直接拿来使用的,里面存在大量的“坑”,而且在规模上Kubernetes应用起来也会产生许多难关。
京东能做起来Kubernetes的优势,首先京东的需求规模很大;其次京东会对Kubernetes做了深度的二次开发,里边很多组件都已经改造成了适合京东业务发展的组件,京东投入了大量资源去深入开发,但更重要的是,我们会与很多系统来集成,容器集群和数据中心的组件是协同发展的,京东会主动去定制适合业务运行的鞋子。
在11月25号的京东技术峰会上,我会详细分享,当你的集群规模达到1000台Node时会出现什么问题,当数量达到3000台、6000台时会出现什么问题,该怎么去解决等等这方面的经验。
6
Q:接下来您的重点发展方向是什么?
A:接下来重点我们要把阿基米德平台推行到京东所有的数据中心,应用到所有的容器集群中,保障业务稳定高性能运行同时,节省TCO降低采购成本。
计划2018年我们能少买一半的服务器设备。 其二,我们还会在开源领域做出一些贡献,把京东经过实践的成熟产品开源出来,与社区分享。
7
Q:您如何看待未来行业的发展趋势?
A:京东2014年开始做容器,在2015年底2016年初,业务100%在容器中运行了,到了去年上半年,京东超过95%的数据库已经在容器中运行,现在京东在阿基米德融合计算方面发力。
所以我们认为未来数据中心的趋势是容器会占主流,不论是公有云还是私有云,因为容器在性能、敏捷性、便利性都能达到一个良好的平衡,数据中心接未来是一个智能化、容器化发展的趋势。
8
Q:您参加过几次京东的大促备战?请谈谈其中的“变”与“不变”
A:我已经经历过10次大促了。其中不变的是,大家一直以技术为核心专注的投入到备战工作。而变化之处还是技术,我们的技术不断革新,每一次备战都会对技术栈进行大的升级革新,我们不仅仅要紧跟技术潮流,还要有一定的超前意识去研究储备技术。
京东现在能在容器领域迅速发展,是因为京东在技术领域一直保持直觉与技术视野,及时储备技术。
9
Q:在11月25日即将举行的京东技术“11·11”基础架构峰会中,您会分享些什么内容呢?
A:我会着重分享,JDOS阿基米德的研发经验以及在底层系统角度处理线上紧急问题时,是如何在不影响线上业务的情况下解决问题的,也会分享一些京东阿基米德平台在调度、提升服务器的使用率方面,如何实现使用更少的机器运行更多的业务。
另外,JDOS2.0在本次“11·11”已经全面上线了,相信大家也会十分好奇基于Kubernetes的阿基米德平台上是怎样支撑京东大规模的促销活动的。
京东技术:11.11基础架构峰会
将在11月25日,国家会议中心举办