探秘腾讯网络备件管理演进

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网络与服务器领域,规划、运营、研发、服务等层面的实战干货,期待与您的共同成长。

前言

网络备件是网络运营的生命线,网络设备硬件故障处理离不开备件服务的支撑。备件服务模式可分为厂商备件服务和自有备件服务,两种模式各有特点。如何根据网络规模和运营能力选择合适的备件模式;如何有效的开展精细化的备件管理为网络运营提供优质可靠、低成本的备件服务,是我们在网络备件管理工作中需要解决的问题。

腾讯网络备件管理经历了三个主要阶段,从最初厂商备件模式到厂商备件加自有备件的混合模式,再到精细化的备件管理,我们在备件模式的选择和备件管理精细化程度上都在不断进化。

本文结合网络备件模式的特点为大家讲述腾讯网络备件管理的演进之路。

一 网络备件模式

厂商备件即由网络设备供应商提供硬件维保服务(软件服务+备件服务),发生设备硬件故障时由厂商将备件寄送至故障机房支撑故障处理。网络设备供应商提供的硬件服务按照等级从高到低有7*24*4、7*24*NCD(下一自然日)、7*24*NBD(下一工作日)等。厂商备件模式的优点为不需要对备件进行具体的管理,但备件响应时长不能完全满足运营需求,备件费用随设备数量线形增长。

自有备件即由网络运营方采购同型号的网络设备作为备件,发生硬件故障时备件由运营方负责管理和调用,厂商仅提供软件服务支持故障处理。自有备件模式的优点为响应时长更能贴合运营需求,当网络规模较大时备件总成本较低。但在初期需要较大成本投入进行备件采购,过程中还需进行备件补充。自有备件覆盖的范围越大,投入的管理成本也越高。

二 备件模式的演进

早期腾讯网络整体规模不大,备件服务采用厂商备件模式。随着网络规模的扩大,厂商备件成本不断增加。厂商备件服务承诺的备件到位时间为4小时,加上设备替换时间,故障恢复时间较长。单一的厂商备件模式受到不断增加的备件成本和响应时长的双重挑战。

为应对成本和响应时长的挑战,我们引入了自有备件模式作为补充。根据网络设备在网络架构中的层次、冗余性和规模综合评估响应时长和成本,将接入层设备由厂商备件模式替换成自有备件模式。

响应时长评估:承载网、城域网核心设备完全冗余,厂商备件4小时送达时间能够满足故障恢复SLA时限要求。接入层设备并非完全冗余,对故障恢复SLA时限要求较高,使用自有备件更能贴合运营需求。自有备件快速响应的特点需要常备机房驻场人员才能充分显现,在网络驻场人员就位的情况下从领取备件到到达故障处理现场的时间不超过20分钟。

备件成本评估:承载网、城域网核心设备规模小、同型号设备数量少、备件采购单价高、利旧资源少,使用厂商备件模式成本较低。接入层设备数量庞大、设备采购单价低、利旧资源较多,使用自有备件模式在成本较低。(利旧指因产品架构升级或IDC裁撤下架的非故障网络设备整机、部件重新使用。)

在评估成本时我们还需要注意两种备件模式在成本投入时间上存在较大差异,应根据设备折旧年限评估每一年的成本和总成本。

厂商备件成本=设备数量*硬件维保价格*设备折旧年数

自有备件成本=备件采购+备件补充+设备数量*软件服务价格*设备折旧年数

三 精细化的备件管理

为了提供更好的备件服务并降低备件成本,我们朝着精细化的备件管理演进,并不断尝试和创新。

厂商备件管理方面,随着架构的优化和整体运营能力的增强,我们选用不同等级的厂商备件服务,将城域网核心设备服务等级从7*24*4降至7*24*NCD,降低备件成本。

自有备件管理方面,在接入层备件实行部件化管理,当交换机电源、风扇故障出现故障时仅需更换同型号的电源和风扇,而不用更换整机,省去了故障处理过程中机器上下架、设备配置导入等环节,提升了故障处理效率同时也节省了成本。未来我们还会在核心层开展自有备件试点,评估核心层设备自有备件对运营效能的影响。

精细化的自有备件管理,需要有相应的流程、工具和人来支撑,我们主要对自有备件管理中的五个子流程进行管控。

1备件库搭建

根据不同网络设备故障恢复SLA时限要求,分别建立园区备件库和城市备件库(逻辑),覆盖当前城市所有机房设备的备件使用需求。

2备件容量管理

容量管理结果直接决定了备件支撑率和成本,根据网络备件的特性可建立概率性需求模型,同时需考虑备件补充周期和可用性风险。模型中备件库覆盖设备数量、设备故障率的变化都会影响备件库容量模型的计算结果,同时故障替换消耗的备件会影响备件库存量。备件容量管理是一个动态管理过程,需要有标准流程和支撑系统对影响备件容量的事件进行管理。

3备件补充

根据容量评估结果对网络备件进行补充。备件来源包括备件调拨、利旧和备件采购,充分使用利旧资源可降低成本,缩短备件补充周期。

4可用性管理

根据备件出入库流程、备件库6S标准对现场备件的出入库、存放合规性进行管理;根据备件抽检流程对备件进行通电检查和OS版本检查,保证备件能够在第一时间转入运营。

5备件使用

网络备件仅限于故障设备替换、故障测试时使用。我们通过备件资产领用返还流程和线上化系统对备件的使用进行管理,网络运营人员新建故障工单保证备件使用需求合理、向现场派发备件出入库工单保证出库型号和数量的准确性、通过配置变更系统保证设备状态准确。

小结

网络备件管理的每一次演进都是围绕备件服务质量和成本进行的,当中也离不开人、工具和流程的支撑,只有整体运营能力提升,精细化的备件管理才能落地实施。本文通过网络备件管理的演进向大家介绍了不同网络规模下备件模式的选择和自有备件的管理方法,希望本次分享能帮助大家通过精细化的备件管理为网络运营提供高质量、低成本的备件服务。

注1:凡注明来自“鹅厂网事”的文字和图片等作品,版权均属于“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用,如有违反,一经查实,将保留追究权利;

注2:本文图片部分来至互联网,如涉及相关版权问题,请联系judithliu@tencent.com。

原文发布于微信公众号 - 鹅厂网事(tencent_network)

原文发表时间:2015-12-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

机器人技术助力磨削应用实现最大精度和效率

为了解决精密磨削技术方面的老化问题,Echo Hill彻底修改了其机床方案,并配备了Beckhoff基于 PC 和EtherCAT的集成式控制平台... 改良...

29850
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(61)-SOP-产能评估

根据年度销售预测,进行产能评估。 SOP 173 SOP通过长期计划传输到 LIS/PIS/产能 该流程可以以两种不同的起点开始: 以 SOP(销售运作计划)...

51440
来自专栏GIS讲堂

2014年年终总结

        借着这个周末的时间,总结一下我的2014年,同时也计划一下2015年。

13320
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(137)-库存管理

重要性 1、库存资产一般占企业总资产15%-40%; 2、物流及供应链管理研究的主要内容之一; 3、企业竞争的需要; 优点 1、满足客户快速变化的要求,提高客户...

27460
来自专栏人称T客

苹果iOS企业移动化生态系统意外的领导者

在诺基亚塞班系统和黑莓操作系统各占智能手机市场半壁江山的情况下,iOS系统竟异军突起,意外地成为了企业移动化领导性操作系统,这大概连苹果公司本身都没有料到。消费...

35070
来自专栏ATYUN订阅号

Clinc对话式AI为快餐店提供免下车窗口服务

Clinc正将其对金融科技的关注扩展到新的垂直领域,以利用其对话式AI。这家位于Ann arborin的公司最近揭开了它的新系统的面纱,该系统旨在为麦当劳和塔可...

18220
来自专栏VRPinea

iStaging推出平面图新功能,并带来全新360度全景共享平台

上月底,AR/VR平台iStaging宣布推出VR Maker的平面图功能,并且还为用户提供了一个全新的360度全景共享平台。

10700
来自专栏java一日一条

一个32岁入门的70后程序员给我的启示

大家好,我是帅气小伙,今天为大家带来一个非常励志,让我反思的故事。今天为大家讲的是我父亲是如何用行动教会我成为程序员的。

10110
来自专栏喔家ArchiSelf

雾里看花——IIoT

工业物联网(IIoT)正在从概念逐渐变成现实。廉价传感器, 从数据到云端, 以及在浏览器上的仪表盘可以看到更细致和更现实的模型,仿若无处不在。 一些文章通过对雾...

10320
来自专栏Java学习网

一个32岁入门的70后程序员给我的启示

一个32岁入门的70后程序员给我的启示 大家好,我是帅气小伙,今天为大家带来一个非常励志,让我反思的故事。今天为大家讲的是我父亲是如何用行动教会我成为程序员的。...

30590

扫码关注云+社区

领取腾讯云代金券