首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >“阴阳相济,生生不息”——数据中心经典医案赏析

“阴阳相济,生生不息”——数据中心经典医案赏析

作者头像
腾讯数据中心
发布2018-03-16 16:07:42
5550
发布2018-03-16 16:07:42
举报
文章被收录于专栏:腾讯数据中心腾讯数据中心

所谓日久情深,作为数据中心经理,我们常常将数据中心当作自己的孩子,为之挡风避雨,为之担惊受怕。即使只出现风吹草动,我们亦是辗转反侧,夜不能寐。或是久病成良医,多年的磨砺练就了我们一颗“大白”的心。一次“病痛”,一次胆战心惊,方才凝聚出数据中心医案典藏。今天,我们将为大家带来其中一则经典”医案”,请各位看官轻拍。

一、患者基本信息

姓名:XX数据中心

年龄:6岁

职业:互联网&IT

过敏记录:市电抖动或中断,市政施工作业,极端天气等自然灾害。

症状自诉:长期心慌、失眠、多梦、躁动不安;抵抗力弱,难以适应受外界环境变化。

为什么受伤的总是我?

二、初步检查

鉴于患者从事互联网IT行业工作,并长期持续产生上述症状。于是我们仰望星空,掐指一算,还是决定先做一个“X光扫描”一窥究竟。

检查项目:X光扫描

参照说明:

X光片分析:

通过X光片,我们不难看出,患者的病可谓事出有因——既有先天之亏,也有后天不足。

1. 先天之亏:该机房模块仅配备了2套UPS,除核心机架为双路UPS保障,其他机架均为单路UPS。

2. 后天不足:业务布局不合理#1,即使机房内的业务主备模块冗余,仍存在很多单点故障的风险。这是后期业务部署埋下的隐患,详情如下:

1) 近80%的DB类机架在一套UPS下供电

2) 100%的逻辑类机架在一套UPS下供电

3) 100%的接入类机架在一套UPS下供电

#1补充解释

业务布局不合理:IDC行业常见“疾病”,通常指业务侧不了解机房基础环境的架构冗余性,资源侧在分配资源时并不了解业务模块特性,机房运营人员不了解业务架构特性,导致业务上架分配不合理,而显著降低业务可靠性。再加上使用高密设备,很可能将主备模块分布在同一物理设备,同一机架、同一交换机、同一套UPS下,这将显著增加业务中断的风险和几率。

三、治疗方案

先天难改,打娘胎里带来的病根,动则伤筋动骨,事倍功半。于是,力补后天之虚就成了我们的治疗方向。腾讯IDC运营团队主动出击,联合业务、资源团队组建“专家团队“开展”联合会诊“,结合业务架构与特性,制定”疗程“(批次优化整改方案)。

治疗方针:

优化资源,合理分配,规避单点,应急演练。

(1)50%的DB类机架由一套UPS供电,50%的DB类机架由另一套UPS供电。

(2)50%的逻辑类机架由一套UPS供电,50%的逻辑类机架由另一套UPS供电。

(3)50%的接入类机架由一套UPS供电,50%的接入类机架由另一套UPS供电。

通过“复诊”可以发现,资源侧合理的分配策略,将业务的主备模块分布在不同的UPS下供电,从而规避单机架、单交换机、单路UPS供电的单点风险。同时,通过开展联合演习,将故障应急演练落到实处,便可成竹在胸,风雨无忧。

X光片复诊:

参照说明:

患者回访:

现在早睡早起,神清气爽。牙好胃口好,吃嘛嘛香。哦也!

四、医案总结

本例乍看尽是先天不足,好似无力回天。然而,常言“人无完人,金无足赤“——数据中心基础架构也是如此。由于数据中心的发展历程,产生了当前数据中心行业的一大特点“存量数据中心多为Tier2,新建数据中心多为Tier3,凤毛麟角Tier4”。对存量数据中心进行大规模改造显然是得不偿失,而过于追求基础架构的可靠性等级所产生的人力、物力耗费也是数据中心行业难以承受之重。

弥补后天之缺,却往往能峰回路转,事半功倍。这也就要求我们了解业务的架构与特性,并结合数据中心基础环境,进行合理的布局和资源分配。诸如通过规避业务主备模块分布在同一整机、同一机架、同一交换机、同一UPS等策略,显著提高业务可靠性,从而实现低投入高收益。 

但是,古语有云“上工治未病,不治已病,此之谓也”。对于新建数据中心,“治未病”就要求我们在数据中心规划、建设、验收阶段严格把关,将隐患扼杀在萌芽之中。当然,面对已经交付运营的数据中心,我们也不能“放弃治疗”;数据中心运营团队的“临床一线”经验,正是我们“治未病”不可或缺的依据。

国医讲究阴阳协调。行业普遍推崇的数据中心最佳模式——“Tier3的基础架构+五星级运营”,实则与之暗合。设计架构和硬件设施是先天之本,是我们坚实的基础,可谓之阳;运营体系则是后天之重,是我们深厚的软实力,可谓之阴。如若阴阳相济,必然生生不息。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-10-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯数据中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档