有备无患——数据中心基础设施备品备件管理

随着云技术、互联网+等理念的不断发展,数据中心行业再次迎来了大规模发展的契机。大量的新技术和新模式推动着数据中心基础设施架构和体系的高歌猛进,而基础设施运营的实力提升则相对缓慢,腾讯数据中心一直关注数据中心基础设施运营管理的优化和提升,整理成此文,供君参考。

1 数据中心基础设施备品备件管理现状

数据中心备品备件管理通常分为两大类,一类是基于IT设备的备品备件,例如服务器(硬盘、内存等)、网络设备备机备件(模块、板卡等),IT线材(网线、光纤、电源线);另一类主要是基础设施备品备件。

IT备品和备件管理由于其数量大、种类多、SLA要求高,经过多年的发展,已经形成了线上化、部件化、例行化管理,可以满足业务长期发展的运营要求。然而基础设施备品备件的管理却普遍为粗放式管理——线下管理、管理颗粒度大、难以快速定位、没有定期盘点和补仓机制等,已经成为数据中心基础设施管理的短板和瓶颈。

图1 数据中心备品备件管理现状对比

2 数据中心基础设施常用备品备件

备品、备件作为故障抢修的重要物资,需要保证高可用性(即取即用)。因此,除了确保备件按序分类存放,还应该对备品、备件提前进行必要的特殊处理。例如应急电缆,应该提前做好铜鼻子,以缩短应急抢修的时间。

1

配电系统

备件

要求

应急电缆

要求合理的线径,两端做好铜鼻子以便直接使用

HVDC整流模块

按厂商分别备份

PDU

各类PDU预留(交流、直流)

空开

各级空开预留

柴发启动电池组

定期检查电池液位,接线端子是否腐蚀

柴油

明确供油协议,定期检查油品质量、储油量等

2

空调系统

备件

要求

雪种

储备充足

压缩机

按精密空调型号对应储备

皮带

保持可用

阀门

各级阀门均需预留

3

其他系统

备件

要求

灭火器

定期检查,确保可用性

应急照明电筒

定期充电、检查,保障可用性

3数据中心基础设施备品备件管理思路

基础设施是数据中心的重要基础平台,而数据中心基础设施备品备件可用是应急抢修的保障前提,因此我们需要建立完善的备品备件管理机制。

1

线上化管理

目前国内大部分数据中心内,基础设施备品备件管理普遍采用线下表格管理模式,难以确保备品备件信息的实时更新,无法保障备品备件的出入库准确性,在资产管理的审计中存在较大的风险。

对于新建数据中心,我们建议在数据中心自动化管理平台中增加基础设施备品、备件管理的功能,并结合采购流程、事件(问题)管理、变更管理流程、报废流程等实现在线式管理。

如果已经投产的数据中心自动化管理平台无法实现备品备件管理功能,我们仍建议采用excel表格管理的初级管理方式,并配合以定期的盘点审计机制予以保障。

2

集中分类管理

基础设施备品备件通常数量不多,但是占地面积较大,存放较为不便,容易随意堆放。对于备品备件的管理产生较大的影响,甚至可能影响应急抢修的及时性。

因此,需要配置专用的库房用于存放数据中心基础设施备品备件,并保障库房的温湿度、配以CCTV监控以及门禁管理。同时,需要精细的分类存放,通常可以将库房空间划分为不同的货架、货区,并将对应位置关系更新至线上系统管理系统中。

3

定期盘点与审计

盘点与审计是资产管理的重要手段。以腾讯数据中心IT备件管理为例,我们建立了多层级的盘点与审计机制。

级别

盘点与审计人员

周期

0

资产管理员

每周

1

外包主管

每月

2

数据中心经理

每月

3

运营中心

每季度

4

部门

每半年

5

公司

每年

因此我们建议数据中心基础设施运营团队建立适宜的盘点与审计机制,例如:

级别

盘点与审计人员

周期

0

基础设施外包团队

每周

1

运营商机房经理

每月

2

部门

每年

4

备品备件补充

通过定期的盘点与审计,并结合历年基础设施故障情况,我们可以制定基础设施备品备件的补充规范。由于通常预算制定以年为单位,我们建议备品备件的采购预算也以年为单位统计设定,并根据实际使用情况及时补充。

5

备品备件存放环境

上文提到备品备件的可用性至关重要,因而对存储库房环境也是有特殊要求的。在IT库房管理中,除了7*24监控外+门禁,我们通常要求库房保证稳定的温湿度、防水、防虫鼠等;同理,数据中心基础设施备品备件库房也需要保持同样的标准。

图2 备品备件存放环境

4 结语

在这个风起云涌的时代,数据中心腾云而上,从幕后走向了前台。随着数据中心新技术和设备的普及,数据中心精细化运营的软实力必将成为“云”的核心竞争力之一。

唯有精心管理,方可有“”无患。

版权声明:本文为腾讯数据中心原创,欢迎转载,转载需注明出处并保持原文(包括标题、导语、正文、图片、数据以及文尾的二维码等全部内容)完整。版权均属“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用。

原文发布于微信公众号 - 腾讯数据中心(Tencent_IDC)

原文发表时间:2016-06-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯数据中心

热门话题|T-Block数据中心建设经验分享

曾宪龙:上午好,我是腾讯的曾宪龙,下面我分享的题目叫做T-Block数据中心建设经验分享,也是想借这样一个机会,向各位数据中心建设领域的专家讨教经验。简要介绍一...

4263
来自专栏新智元

【Jeff Dean推荐】为什么说未来的深度学习是小、轻、快

914
来自专栏PPV课数据科学社区

【观视界】浅谈知识图谱

数字化协会理事顾问 广州佰聆数据顾问有限公司解决方案经理 大家好,我是中国数字化协会的理事顾问,郑午。今天与大家浅谈一下-知识图谱。 知识图谱...

9387
来自专栏专知

机器学习应用的未来是什么?微型化

【导读】数据科学家,Jetpac 公司CTO Pete Warden发表了一篇博文,详细阐述了微型化是机器学习应用的一条出路,并且相信机器学习可以在微小的、低功...

1713
来自专栏镁客网

基于现有设备研发的新型量子加密系统,速度是当前技术的5至10倍

1280
来自专栏PPV课数据科学社区

大数据告诉你,红高粱为什么这么红

2014年底压轴大戏、周迅回归电视荧屏诚意之作、诺贝尔文学奖原著作品——《红高粱》于11月17日完美收官,爱奇艺播放量冠绝全网,正片点播量高达8.2亿。在网络平...

2844
来自专栏机器人网

技术猿 | 库卡机器人让焊接单元更紧凑、更灵活

位于德国奥格斯堡的 ENKO Staudinger 有限公司专注于研发、设计和生产模具、设备制造、特种机器和机床。该公司拥有约 70 名员工,他们凭借超过 40...

3669
来自专栏机器人网

自动化工程师涨工资必备的11项技能

工控自动化总体来说属于应用型,也就是说,使用的每一个产品都是别人做好了的,我们要做的就是如何使用,以及二次开发,所以从技术难度来讲,它并不特别复杂,但是,于工业...

3829
来自专栏java一日一条

一个五年 Android 开发者百度、阿里、聚美、映客的面试心经

先简单说说我最近的面试经历吧。面试的公司很多,其中有让我心血沸腾的经历,也有让我感到失望到无助的经历,我将这些体会都记录下来,细想之后很值得,面了这么多公司,要...

1561
来自专栏新智元

深度学习增强毫米级计算机,288 微瓦运行神经网络

【新智元导读】密歇根大学两位计算机科学家,在本月初于旧金山举行的IEEE国际固态电路会议(ISSCC)上,介绍了仅有毫米大小的微型计算机。不仅体积小,原型产品仅...

3599

扫码关注云+社区

领取腾讯云代金券