前言
关于IDC假负载验证测试,“腾讯数据中心”已经发送2篇介绍文章《数据中心假负载验证测试之道》、《数据中心假负载验证测试实战指导方案》,今天我们将以某大型微模块数据中心(简称A-IDC)的假负载验证测试为例,继续为大家剖析假负载验证测试情况。
一、假负载验证测试问题概述
A-IDC假负载验证测试主要由基础设施验证测试和微模块验证测试组成。该项目验证测试累积发现基础设施问题280项,微模块测试问题381项。测试发现的问题主要分为4类:设计问题、设备选型问题、设备质量问题、施工工艺问题。
总体来看,设备质量问题和施工工艺问题合计占比97%,设计问题和设备选型问题较少。因此,我们可以看出:
(1)项目设计及设备选型情况较好
验证测试中仅出现少量设计问题和设备选型问题,可见前期设计沟通和设备选型把控较好;
(2) 厂商设备安装自检需要加强
无论设备质量问题、施工工艺问题,都应该在厂商安装自检过程中发现和解决。
二、基础设施验证测试问题分析
基础设施主要覆盖发电机系统、空调系统、配电系统(含空调配电)和其他系统(如门禁、消防、管控等)。
从故障类型分析可以看出,基础设施验证测试问题中施工工艺问题占比57%,占据较重的比例。而施工工艺问题典型案例为设备和线路标识缺失、部分线缆未做铜鼻子、母线安装未点漆等。
对应于每个系统,我们分析发现主要的测试问题如下:
系统 | 主要问题 |
---|---|
发电机系统 | 设备标识缺失电量仪显示异常油机配电箱无UPS(施工未完成)一台柴油发电机满载压力测试发生急停(散热风扇皮带断裂) |
空调系统 | 设备及管道标识缺失群控系统控制逻辑异常一台冷机故障冷却塔漏水,冷却塔液位监控告警异常,无维护作业防护装置(施工未完成)市电中断,蓄冷罐未立即放冷;市电恢复,冷机无法自启动 |
配电系统 | 设备及线缆无标识(施工未完成)电量仪大量显示异常,动环系统监控及显示异常零排线缆未压铜鼻子,母线安装未点漆,部分铜排无绝缘热缩,主、备、进线铜排压接2根电缆的螺栓未突出螺母市电停电母连投入4台变压器同时启动无时延变压器供电时可以开启防护门部分开关整定值未设置 |
其他系统 | 消防联动无法强制打开门禁排烟风机排风方向反置部分门禁异常管控系统数据采集异常、无法导出报表功能 |
空调系统
配电系统
其他系统
三、微模块验证测试问题分析
微模块(MDC)主要由配电单元(列头柜、高压直流模块、PDU)、制冷单元(列间空调、CDU)、管控单元(管控柜、消防控制)和MDC框架(含机柜)组成。此次测试中发现,设备质量问题达74%;施工工艺问题占比24%。
如上所述,MDC作为集成配电、制冷、管控等功能的综合体,涉及的组成部件较多,调试工作量较大。但是经过近几年的应用和积累,MDC假负载验证测试方案已经日趋成熟。MDC各单元测试主要问题如下:
系统 | 主要问题 |
---|---|
配电单元 | 设备和线缆无标识,无系统图电量仪采集和显示异常部分电池温升异常、内阻异常,电池巡检仪读数异常列头柜正负极绝缘告警异常、汇流连接线附件压热缩皮PDU、支路微断开关温升异常HVDC整流模块间歇性工作异常,正负对地电压异常 |
制冷单元 | 空调电源模块故障、风机故障CDU内备用水管未做封堵部分温湿度传感器异常OR故障模块内空调未设置联控部分管道进出水温度异常空调一路电掉电不告警 |
管控单元 | 电量信息采集不准确温湿度采集模块工作异常门禁系统异常CCTV监控视角待调整 |
MDC框架+机柜 | L型导轨毛刺冷通道天窗不吸合冷通道门吸合异常,漏风 |
制冷单元
管控单元
MDC框架+机柜
四、验证测试问题的思考与应对
本文援引的IDC项目假负载验证测试问题累计达600余项,实际上这还未包括建设期间各方已经发现并整改的问题。寄希望于一次假负载验证测试即将所有隐患和问题挖掘出来是不切实际的,那么如何有效规避这些问题就成了摆在我们眼前的重要问题。因此,我们建议从五个环节系统性把控:
(1)设备选型
设备选型是质量控制的源头,通常项目团队可以根据设备长、短名单机制确保入选设备满足项目技术规格要求,同时具有良好的应用经验。
(2)重要设备厂验
对于重要设备建立厂验机制,一方面确保设备备货和生产的真实性,同时在设备出厂前做好设备质量的把控。厂验通常需要涵盖规划、建设、运营团队人员,并提前制定厂验checklist。
(3)设备安装自检与项目抽检
在安装过程中,应敦促施工方按照技术规范要求施工并做好自检工作,且提供自检报告;同时,项目方应按照施工方提供的自检报告进行逐项检查及验收,确保施工质量。
(4)假负载验证测试
假负载验证测试是通过结构化的测试手段对IDC各系统进行质量检查的重要环节,也是IDC项目转移至运营的过渡阶段,必须保障测试的独立性和完整性。确保测试结果的真实性和可靠性。
(5)运营团队复检
运营团队作为IDC项目的最终维护人,需要对各系统进行复检或抽检。一方面作为对假负载验证测试结果的校验;另一方面可以熟悉系统,为接下来的系统运营打下基础。在实际项目运作中,运营团队主导假负载验证测试方案的制定和实施,故而在第三方测试公司开展验证测试的同时,运营团队复检工作将并行开展。
结束语:近年来,IDC假负载验证测试发展日趋成熟,日益得到行业的关注和重视。作为广泛应用IDC假负载验证测试的腾讯数据中心,我们希望将这种切实有用的方法推广至更多行业同仁。“腾讯数据中心”公众号谨以这三篇假负载验证测试文章向致力于推动数据中心不断发展的行业同仁致敬。《数据中心假负载验证测试之道》、《数据中心假负载验证测试实战指导方案》、《IDC假负载验证测试问题分析》。
版权声明:本文为腾讯数据中心原创,欢迎转载,转载需注明出处并保持原文(包括标题、导语、正文、图片、数据以及文尾的二维码等全部内容)完整。版权均属“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用。