浅谈数据中心应急冷源

一.引言

数据中心作为信息通讯的中枢,持续运转的服务器将产生大量的热量,若不及时将热量排出,聚集的热量将会引起服务器高温,从而影响设备稳定运行。

精密空调系统作为数据中心制冷的重要基础平台系统,是数据中心安全、稳定运行的保障。但是在实际运行过程中,空调系统并无法保证“全勤”,空调系统偶然的故障或者电力供应问题均有可能导致空调系统停机。空调系统从停机到再次恢复工作需要一定的响应时间,在该时间段内,服务器依旧处于工作状态,此时仍需要对机房温度进行控制,所以在除了原有空调系统外,还需配备额外的制冷系统,即数据中心的应急制冷系统。

二.应急制冷系统

应急制冷系统,顾名思义,是在紧急状况下对数据中心进行控温的制冷系统。在主空调系统因故障发生短暂停机时,应急制冷系统可立即“接管”控温的工作。因而也被誉为数据中心的第二道“保险”。对大功率、高热流密度的数据中心而言,配备应急制冷系统可进一步提高系统运行的可靠性。

一般而言,应急制冷系统主要由冷源、热交换器、送水/风管路、电源等组成,根据冷源的不同,应急制冷系统可分为两大类:一是双冷源空调系统;二是蓄冷式制冷系统。本文将对两种不同类型的应急制冷系统进行介绍。

1.双冷源空调系统

双冷源空调系统其本质为两套并联的空调系统,如图1所示, 一套为冷冻水空调系统,一套为风冷直接蒸发式系统。两套系统均可以独立为数据中心提供充足的冷量,二者互为备份可极大的提高制冷系统的可靠性。

通常来说,冷水机组具有制冷效率高、设备集中、便于维护、故障率低等诸多优势,因此是数据中心控温的首选。当冷冻水系统制冷中断时,风冷直接蒸发制冷系统将自动开启,对主系统进行“补偿”。值得注意的是,由于冷水机组启动较慢,当风冷系统切换为水冷系统需要更长的响应时间;而水冷系统则可较为顺畅地切换至风冷系统。因此,风冷直接蒸发式系统可扮演应急制冷系统的角色。还需指出,在机房运行初期,上架服务器数量较少,数据中心热负荷较轻,此时常采用风冷系统模式;随着上架服务器数量的增多,热负荷增大,择机切换至水冷系统模式。

图1 双冷源空调系统

2.蓄冷式应急制冷系统

虽然双冷源系统已经大幅度提高了系统的可靠性,但当电力系统发生故障,将引起冷机系统制冷中断,此时需要后备电力系统(如柴油发电机系统)将投入运行。从柴油发电机启动送电到制冷机组重启并到恢复所需的供水温度至少需要数分钟。因此,在该时间段内,数据中心需要启动另外一种制冷系统,即蓄冷式应急制冷系统。

①蓄冷式应急制冷系统简介

蓄冷式应急制冷系统其原理是通过介质将数据中心空调系统运行中的冷量进行储藏,在需要时再将冷量释放出来用于数据中心制冷需求。根据蓄冷介质的不同,目前蓄冷系统主要分为蓄水和蓄冰两种模式,水蓄冷系统是利用水的显热储存冷量(图2),而冰蓄冷系统是利用相变潜热来储存冷量(图3)。与冰蓄冷相比,水蓄冷单位体积内的蓄冷量较小,所需蓄冷罐容积较大。尽管如此,水蓄冷依然是数据中心常用的蓄冷形式。

图2 水蓄冷系统示意图

为什么选择水蓄冷而不选择冰蓄冷呢?数据中心蓄冷装置用于保证制冷系统短时故障期间的供冷,其瞬时用冷量很大,由于冰蓄冷技术的融冰速度有限,不适用于数据中心快速释放储存冷量的要求。相比之下,水蓄冷技术则具有如下优势:

(1)响应快:水蓄冷系统的冷水温度与原系统的空调冷水温度相近,可考虑直接使用,即与原空调系统进行“无缝”连接。

(2)安全系数高:水蓄冷系统结构简单,环节较少,故障率低。

(3)成本低:水蓄冷系统耗电量低,技术要求低,运行费用低。

图3 冰蓄冷系统示意图

②蓄冷设备的连接方式

蓄冷罐作为附加的冷冻水储备设备,是蓄冷系统重要组成之一。它具有应急冷源功能,可保障冷源系统失电后数据机房区的正常供冷。当冷水机组因失电停机后,蓄冷罐将作为应急冷源与冷冻水系统构成应急制冷系统。当柴油发电机正常运行且冷水机组恢复供电后, 蓄冷罐停止供冷,重新切换为蓄冷工况。蓄冷罐与冷水机组主要有两种方式连接:

(1) 冷水机组与蓄冷罐串联

图4 冷水机组与蓄冷罐串联

蓄冷罐串联接入用于空调系统的容灾备份,冷冻水流经蓄冷罐以保证随时供应冷量 (图4) 。该连接方式控制相对简单, 冷冻水直流过蓄冷罐无旁路冷损失。其缺点是蓄冷罐会增加管路系统的流动阻力,从而致使水泵能耗升高。

(2) 冷水机组与蓄冷罐并联

蓄冷罐并联接入主空调系统:蓄冷模式时,冷水机组对蓄冷罐进行充冷;放冷模式时,蓄冷罐为末端负荷提供冷源。该连接方式控制相对复杂,冷冻水需要经旁路流入蓄冷罐会产生一定冷损失,但此方式对系统阻力的影响较小。

③蓄冷罐结构形式

鉴于水蓄冷在数据中心的广泛应用,此处重点阐述水蓄冷罐。一般地,水蓄冷主要有开式、闭式两种形式。开式蓄冷罐与外界环境连通,具有气液界面:其体积较大,不利于灵活布置,因此通常至于室外。相比之下,闭式蓄冷罐体积小,因此可以方便的在室内布置。

蓄冷罐的设计取决于数据中心所需要的额定制冷量,而该冷量取决于水的比热、体积等,还与罐体与周围环境的热交换有关。在忽略罐体热损失的情况下,蓄冷罐容积可根据热平衡进行估算:

其中,V为蓄冷水量(m3);Q为额定蓄冷量(kw);η为蓄冷装置的容积效率,一般取0.96~0.99;ρ为蓄冷水密度,取1000kg/m3;为释冷回水温度与蓄冷进水温度间温度差;Cp为水的定压比热容,4.2kJ/kg/℃。

图5 某数据中心水蓄冷罐

④蓄冷设备的其他用途

蓄冷罐等蓄冷设备不仅可以用作数据中心应急制冷,同时也具备了其他辅助功能,如峰谷电价运营调优、早期低负载运行调优等。

(1)峰谷电价运营调优:当蓄冷罐容量较大时,我们可以利用峰谷电力价格的差异,选择在夜间蓄冷,白天通过蓄冷罐给数据中心制冷的模式进行调优。尤其在电力缺乏的区域,具有较大的潜力。除了数据中心行业,其他领域也有广泛的应用,如图6为某机场配置的蓄冷罐系统。

图6 蓄冷罐系统

(2)早期低负载运行调优:大型数据中心通常采用大型冷水机组,但在上架初期,由于上架量少,机房热负荷较低,此时既可采用风冷系统,亦可采用水冷系统。当采用水冷系统时,冷机系统长期处于低负载运行状态,甚至有可能无法正常运行。因此,部分机房在除配备大型冷水机组以外,还增加了1~2套螺杆机组(容量较小),以用于早期低负载运行。待上架量提升和稳定后,再采用大型机组作为日常运行方式,螺杆机作为备份机组。这无疑增大了制冷系统的复杂性。若在制冷系统中配置蓄冷罐,则可很好地解决该问题:先通过大型冷水机组向蓄冷罐提供冷量,再通过蓄冷罐为早期低热负荷的机房进行温度控制。该方案既可以实现峰谷电价调优运行,还可以简化机房制冷系统配置。

3.其他应急冷源

双冷源系统、带蓄冷设备的冷水系统基本可以解决数据中心制冷的主要痛点。但在一些特殊情况下,如对水冷系统的主管阀门进行维护或更换、MDC末端Y型阀门故障更换等。在这个过程中,虽然末端CRAC仍然可以保持运转,但冷冻水的供应出现中断,机房温度面临骤升的紧急情况。另外,当数据中心开展计划性维护作业,尽管我们可以协调业务侧对非关键设备实施停机维护。但对于重要的网络核心、DB等核心节点设备,我们仍需要重点保障。在这种场景下,我们仍需要探索一些新的冷源。最简便的办法是与制冰厂进行协调,提前调用冰砖(图7),并辅以大功率风扇制冷。

图7 某数据中心应急备用冰砖

有数据中心同仁也提出将干冰作为数据中心备用冷源。因为干冰运输方便、使用过程中由固态转化为气态,不会在机房内产生液体从而对服务器的运行造成不良影响。因此干冰可作为机房应急制冷的备选。但是,干冰的大量使用,可能导致机房内二氧化碳浓度在短时间内急剧升高,可能对机房运维人员产生不利影响,因而在目前的数据中心鲜有采用干冰作为应急冷源。后续我们也将对干冰作为应急冷源的可靠性、可行性进一步研究和探讨。

三.总结

随着大型数据中心基础设施架构设计的不断优化和完善,蓄冷罐已经作为水冷系统中应急备份的重要冷源而被广泛使用。但也有些机房由于内部规范的要求,对一定规模以下的数据中心仍主推双冷源系统,同时也将冰砖等移动式冷源作为数据中心最后的制冷保障手段纳入到数据中心的应急响应中。

无论哪种模式,都是在基础设施架构层面进行充分的考量。但要真正实现制冷系统间平滑切换而不影响业务运营,仍然需要经过大量的运营培训和实操。在数据中心验证测试阶段,运营团队需要充分验证制冷系统是否可以覆盖各种场景,并形成相关的应急预案;还需定期开展模拟演练。只有真刀真枪的演练,方能临危不乱,应对有序。

原文发布于微信公众号 - 腾讯数据中心(Tencent_IDC)

原文发表时间:2017-05-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

把14亿中国人都拉到一个微信群在技术上能实现吗?

最近,知乎上有一个非常热门的问题:“把 13 亿中国人民都拉到一个微信群里在技术上能实现吗?”

1983
来自专栏opengps

[置顶] 互联网定位技术小谈

今日小编在此为大家介绍一下互联网中所应用的定位技术。互联网的发展日新月异,技术迭代很快,各行各业的智慧在互联网这片蓝天下碰撞结晶,造福大众。今天要讲述的集中定位...

4766
来自专栏阮一峰的网络日志

每周分享第 30 期

欢迎投稿,请前往 GitHub 的 ruanyf/weekly 提交 issue。

1082
来自专栏机器人网

一种嵌入式智能寻迹机器人设计

 1 引言   在信息技术的飞速发展,计算机,通讯、消费电子三种技术合一的后PC的时代,虽然计算机和网络已经全面渗透到日常生活的每一个角落,但各种各样的新型嵌入...

4469
来自专栏安恒信息

黑客展示利用廉价设备入侵任意车辆

汽车厂商一直以来都对汽车面临的黑客攻击轻描淡写,认为网络系统的扩大可以提升安全性。但现在,两位安全人员却计划借助一款跟iPhone差不多大小的...

3706
来自专栏知晓程序

别人用微信聊天聊出了对象,而你呢?就知道发表情包!

8092
来自专栏阮一峰的网络日志

每周分享第 33 期

欢迎投稿,请前往 GitHub 的 ruanyf/weekly 提交 issue。

1602
来自专栏镁客网

「镁一刻」苹果iPhone7有望搭载OLED屏,一加手机X亮相发布会

1493
来自专栏Jerry的SAP技术分享

SAP数据中心概述

Jerry的前一篇文章企业数字化转型与SAP云平台介绍了SAP云平台在企业数字化转型中的重要地位和作用。作为一个平台即服务(PaaS)解决方案, SAP云平台实...

2062
来自专栏知晓程序

拯救你的「佛系」朋友圈!这 3 个装 X 利器,第一批 90 后都在用

可是,到自己发朋友圈的时候,似乎也只有那几种选择。有没有办法能拯救「朋友圈荒」呢?下面这几款小程序,说不定就能帮到你。

1474

扫码关注云+社区