浅谈腾讯数据中心现场外包管理

互联网业务增长快,变化大,涉及到所需的数据中心的各类网络/计算资源瞬息万变,需要大量的人力对现场运营进行支撑,我们以一个实际运营十万台服务器的数据中心为例。整个现场运营主要分为三大部分:IT现场运营,基础设施运营,以及物业/安全/后勤保障。

从图中可以看出,腾讯自有人员主要是各模块团队的现场管理人员和专家团队,大量的现场运营操作维护人员等都外包给专业服务公司,因此,现场外包管理是数据中心运营核心。

外包人员数量模型决定于以下几个因素:

服务器现场运营人员数量模型因素:人员能力(经验及技能),服务器数量(IDC规模),资产管理人员,服务器产品质量;

网络现场运营人员数量模型因素:人员能力(经验及技能),网络架构,网络质量;

电力设施现场运营人员数量模型因素:高/低压日常巡检维护值班人员7*24小时,电气工程师,电气二线支持专家,厂商维保服务支持;

制冷系统现场运营人员数量模型因素:日常空调巡检维护值班人员7*24小时,空调工程师,暖通系统二线支持专家,厂商维保服务支持;

物业管理/保洁/保安等人员数量模型因素:园区大小,日常门卫管理/保安巡逻7*24小时,园区物业,环境保洁,环境安全,中央监控系统完备性等。

随着这几年的运营管理经验积累,我们对整个外包服务管理模型不断的进行优化升级,建立起以数据中心经理为核心的IDC现场运营管理体系。数据中心经理主要工作框架如下:

在整个外包管理体系中,核心就是管人(关注外包人员的管理)、管物(现场资产管理)和管事(现场运营,流程运作,可靠性管理,容量管理,成本管理等)。

本期简要介绍的是腾讯数据中心现场外包管理的模型架构,后面将分期介绍IT现场外包管理,基础设施外包管理,物业安全后勤外包管理等,敬请持续关注!

【IT现场外包管理】

腾讯数据中心的IT现场外包主要指服务器和网络的现场支撑服务,海量的服务器和网络设备,直配、上架、硬件更换、设备巡检、搬迁、基础故障处理,退役等重复性和例行化的标准操作层工作,量大且比较标准,外包给专业的服务厂商处理。

我们一方面通过以ITIL为指导来制定标准的操作流程和操作指引,引导现场外包人员按流程执行;另一方面由于这些标准操作工作,枯燥重复,冰冷的IT设备等势必会导致人员对工作研发厌烦,所以我们更加聚焦关注现场人员的管理:能力和意识培养、工作组织、梯队建设、团队、考核。制定人员基础职业牵引,搭建知识学习和分享提升平台,建立金字塔式的人员组织架构,定期的各种类型的组织氛围建设活动,使得外包人员获得很高的岗位认同感、职业成就感和工作归属感。

在IT现场外包管理中,数据中心经理是本机房外包管理责任第一人,聚焦做好外包工作的标准化制定、外包工作计划、运营任务管理、执行过程监管,以及外包人员的技能培养和外包商/人员评估考核。

【基础设施外包管理】

腾讯作为一家互联网企业,业务核心聚焦互联网用户的业务发展,对于数据中心的专业基础设施,不太可能完全通过自身的技术人力来做好设施设备的维护保养工作,专业人员的能力培养及发展也势必受到一定的约束。

我们把这一部分的维保工作通过专业的厂家来执行,聚焦于外包维护的计划、执行监管和优化层面。具体执行方法:我们会同外包厂商一起制定一套完整的运维服务体系,通过考核评估充分引导厂商用自身的服务专业性来保障基础设施的稳定运营。

数据中心基础设施外包服务质量的一个重要衡量指标--可用率。IDC基础设施可用率关键因素:电力系统可用率和制冷系统可用率;国际通用数据中心认证标准Tier4的指标为:可用性99.995%、年平均故障时间0.4小时。为保障数据中心基础设施的高可用性,在做好日常维护工作的同时,重点做好应急演练,故障隐患管理和备品备件管理。

【物业安全后勤外包管理】

在腾讯数据中心运营过程中还有一个看似不起眼但实际很重要的一块:物业安全后勤。数据中心园区大,设备多,风火水电纷繁复杂,物业包含园区人员出入,机房人员/资产出入,环境的整洁等;安全人员需要负责园区内的环境安全,人身安全;后勤保障数据中心的人员一些物质供应等。

这部分腾讯数据中心全部采用外包方式给专业的物业公司来进行管理运营。我们在要求物业公司做好整个园区的管理基础上更加关注安全管理,制定完备的安全管理体系制度要求物业公司严格遵照执行,确保腾讯数据中心园区内的人身安全和资产安全。通过逐步细化式区域划分制定安全方案:

1、 结合IDC规划及建筑实体,将IDC划分为园区、建筑物单体、功能间。

2、功能间根据其规划用途不同进行划分:

IT设备间: 即俗称的机房,包括电信网络核心机房、业务运营机房、测试机房;

基础设施间: 存放基础设施的功能间,包括存放供电系统、制冷系统等的房间;

公共设施间:IDC的公共接待及存放环境公共设施的功能间,如:如大堂、消防间、报警阀室、监控室、卫生间、电梯间、茶水间、天台等;

办公运维间:指IDC内人员办公使用的功能间,包括:办公室、IT值班室、设备值班室、高压值班室、会议室、库房、交接区等。

在划分好区域后建立基于安全区域划分的物理安全管理策略和实施指引:

腾讯数据中心运营现场纷繁复杂,现场外包管理体系正在逐步建设中,如何更好的高效管理外包来聚焦核心业务,正在逐步摸索和完善中,期待我们每一个人去摸索和前进……

版权声明:本文为腾讯数据中心原创,版权均属“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用。

原文发布于微信公众号 - 腾讯数据中心(Tencent_IDC)

原文发表时间:2014-10-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小程序的营销

如何避免成为一个佛系的运营人?

2017 年互联网发生了不少事,微信小程序诞生、共享经济火爆、饿了么合并百度外卖、全民手游王者荣耀月流水达 30 亿元、携程深陷舆论漩涡、天猫双 11 交易额 ...

20430
来自专栏CDA数据分析师

到2020年,智能手机将拥有的十项AI功能

? 近日,Gartner 列出了人工智能手机的十大「高影响力」应用,并称这些应用将为设备供应商赋予「更高级」的用户体验,从而为客户带来更多价值。 它还预测,到...

20860
来自专栏罗超频道

安全教父周鸿祎:万物互联时代面临六大安全挑战

2014中国互联网安全大会9月24日上午在北京举行,2013年周鸿祎提出了泛安全的概念,要让用户用手机和电脑用得更爽,这一次周鸿祎讲了什么?且看实录。 非常感...

34450
来自专栏BestSDK

百度开放定制化训练平台EasyDL,不懂代码也能玩转AI

百度对人工智能战略的重视程度无需多说,在AI时代里,百度的愿景是希望每家企业都能轻松接入AI,每个人都能实打实的用上AI。为实现这一目标,百度除了忙着在与知名企...

14660
来自专栏华章科技

苹果与Google的文化之咒

我们常说要居安思危。但是对于许多伟大的公司来说,最大的问题是他们看不到危机的存在。为什么会看不到危机?因为根深蒂固的文化已经让组织所有人都形成了一组基本的假设,...

9330
来自专栏云计算D1net

真正使用大数据的4个方法

大数据已经在媒体和IT企业中大量提及,但是有多少企业真正在使用大数据?又有多少企业从大数据中受益呢?真正使用好大数据是不容易的事情。 2014年,美国的...

28130
来自专栏云计算D1net

盘点与云计算密切相关的市场热捧产品

云计算,即一种基于因特网的超级计算模式。随着国家宽带提速的战略的提出,云计算得到更进一步推动。毫无疑问,21世纪中,云计算被视为科技业的一场新的革命。而云计算的...

30150
来自专栏软件测试经验与教训

测试团队管理 - 执行力

33080
来自专栏企鹅号快讯

人工智能来了!实体零售会变成什么样?

今年在深圳一些零售终端也开始利用AI——“人脸识别”系统,以此来统计门店真实的客流量。这也意味着,新零售元年之战,人工智能让实体零售的未来有了更多可能!面对一次...

28190
来自专栏速成应用小程序开发平台

微信小程序备受用户喜欢对APP是否有影响最终会被取代吗?

自小程序2017年1月9号正式上线以来,不论是中小商家,还是各大品牌巨头,都在抢占小程序这波风口,打造属于自己的小程序。截至目前,全国正式上线小程序超过100万...

19140

扫码关注云+社区

领取腾讯云代金券