首页
学习
活动
专区
工具
TVP
发布

数据中心供配电系统智慧运维探讨

摘要:供配电系统是数据中心基础设施的重要组成部分,各类IT设备计算、存储离不开供配电系统平稳、安全地运行。伴随数字产业的发展,数据中心供配电系统也在扩容壮大,这对供配电运维提出了更高的要求。为助力数据中心可靠运行,实现绿色节能、可持续发展目标,新一代供配电系统智慧运维技术应用势在必行。

随着新时代数字经济快速发展,数据中心建设规模不断扩大。原有数据中心用电负荷小,供配电系统接线单一,结构简单。现行主要数据中心建设规模均超过了3000个机架,甚至达到万架级别,其供配电系统建设容量超过10MVA,配置变压器数量大、系统接线复杂。供配电系统在数据中心运行中具有举足轻重的地位,提升运维水平对供配电系统安全可靠运行至关重要。采用人工运维方式已无法满足大型数据中心运行需求,引入新技术对供配电系统实施智能化运维管理模式将逐渐替代原有传统模式。

1、数据中心供配电系统运维背景

在信息产业发展初期,技术不够先进,数据机房规模较小,通常仅需布置于一栋建筑的某层,与办公、动力等建筑电气负载共用1套变配电系统,机房不间断电源只需从大楼0.4kV配电装置引接,日常只需通过人工方式简易运维。数据机房电源投入或切断只涉及少量低压断路器、隔离开关的分合闸操作,日常巡查内容主要为主配电柜、不间断电源、蓄电池的运行工况,运维人员也只需要具备简单的低压配电知识。

随着时代发展,机房需求急速增长,独栋数据中心甚至数据园区建设成为常态,高功率机柜也逐渐成为机房标配,用电负荷快速增长,电源系统电压等级提升到10kV专线甚至是110kV、220KV专线。数据中心供配电系统所包含的高压配电装置、变压器、低压配电装置、不间断电源或高压直流电源等设备容量不断扩大、数量不断增多,系统也越来越复杂。对于不断发展的数据中心供配电系统,传统人工运维方式无法适应,弊端逐渐显现。人工成本高,各环节供配电设备间也存在数据互联互通难、无法实时控制、智能化水平低、安全可靠性差等问题。数据中心供配电系统运维在空间维度上也无法做到监管的面面俱到,存在维护人员误报、漏报、瞒报等现象;在时间维度上运维更是滞后,对于风险、故障的处置往往由于数据滞后导致不准确、不及时。特别是在疫情防控期间,在使用人工和传统管理手段的数据中心,由于运维人员不能如期复工,数据中心的运行受到极大影响。

2、数据中心供配电系统智慧运维的意义

当今,智能监测、物联网、大数据等先进技术日渐成熟,为数据中心供配电系统建立科学的智慧运维模式创造了条件。在数据中心供配电系统各环节、各节点设置监测点,采集电力参数信息并上传后台,运维人员在监控室即可查看各设备运行工况,减少了现场巡检次数,大大降低了人工成本。

数据中心供配电系统先进智慧运维技术的运用,有机融合技术、数据、流程等,不仅提高整体工作效率,而且有利于保障工作效果。智慧运维通过远程遥测、后台分析判断、远程遥控等技术,在某个供配电系统设备发生异常事件情况下,可以立即执行标准管理流程,顺利完成工作任务,提升了运维管理流程的水平。智慧运维技术对设备运行数据长期保存,并通过科学建模及大数据分析,对系统可能出现的故障做出预警,对故障点定位并做出预判,极大地提高了供配电系统运行的安全性。因此,供配电系统智慧运维提高了数据中心运维的智能化水平,有效解决了数据中心规模扩大后带来的一系列运维问题。

3、数据中心供配电系统内容

数据中心IT设备运行具有连续性特征,用电持续高负荷,在其供配电系统设计过程中应综合分析电能负荷性质和周围区域电量供应。同时,数据中心对电源各电力参数指标、供电可靠性有很高的要求,供配电各环节配置应有利于系统运行的稳定性、电能输配工作的有序性,保障数据中心正常运行。

大型数据中心负荷高,从经济性方面考虑,后备电源系统一般采用中压发电机并机复用方案,中压发电机、中压并机系统均统一布置于独立动力中心。中压配电装置、变压器、低压配电装置、不间断电源或高压直流电源布置于数据中心机房各楼层中部,近负荷中心布置,设变配电室、电力室、电池室等。数据中心机房主要布置于各楼层两侧,配电设备主要有微模块柜顶双母线配电单元、末端空调配电箱等;数据中心一层还布置有冷冻机房配电间,以及常规建筑电气配电箱。数据中心供配电系统具有设备多、分布广等特征,日常维护管理内容多。

云计算、大数据金融科技等数字产业均对数据中心的运行有很高的要求,数据中心建设主要按《数据中心设计规范》中A级数据中心建设要求实施,其中供配电系统应具备容错能力,从前端到末端全程双回路供电;变压器、不间断电源、高压直流电源、发电机等设备配置冗余容量,互为备用运行;同时,考虑数据中心建设投资的经济性,不间断电源、发电机等设备采用多模块并接方式,节省投资也便于后期局部更换。因此,数据中心供配电系统还具有子系统多、接线复杂等特征,出现人为失误或判断错误均有可能造成数据中心运行事故,造成重大经济损失。因此,各供电方式切换、故障运维处理需经过大量逻辑分析、流程管理,最后才能实施操作、维修,这给运维人员带来了极大的压力。

4、数据中心供配电系统智慧运维应用原则

4.1 安全运维

数据中心供配电系统智慧运维应用应建立在安全基础之上,注重安全管理机制建设,落实数据分类分级、重要数据保护、数据管理成熟度评估,积极组织做好各子系统数据安全共享、协同处置、算法规制、流程科学建模,时时加强数据安全关键技术创新突破,及时消减数据安全、运行安全重大隐患。

4.2 科学运维

数据中心供配电系统智慧运维使用先进智能化技术,实现降低运维成本、规避人为因素造成运维风险的目的。智慧运维系统应优化缩减人工巡检梳理工作内容,实时监测设备运行工况,提示设备运行潜在风险,及时发现并处理故障,并且建立规范流程,有序落实自动化电源控制模式,合理可靠使用电力资源。

4.3 经济运维,绿色节能

数据中心运行耗电量大,属社会碳排放较高的产业,在“双碳”背景下国家对数据中心能源效率指标(PUE)要求不断提升,数据中心绿色发展任重道远。数据中心供配电系统智慧运维应坚持绿色发展,着力创新引领。智慧运维系统应注重各子系统、各供电环节能耗分析,确定机房最经济运行形态,提出微模块IT设备布置方案、功耗控制区间等;智慧感应外界自然条件,通过配电开关合理控制空调系统运行组数,或直接投入新风系统利用自然冷源制冷;根据波峰波谷电价智慧蓄能蓄冷,落实错峰调节数据中心基础设施运行模式,有利于显著节省电力能源;智慧控制照明系统,运用先进感应技术关停非必要辅助功能设备用电。

4.4 具有发展适应性

智慧运维系统应采用开放式的信息体系架构,使用标准通信协议,以满足系统数字化升级需要,进一步优化整体系统的功能,适应数据中心发展需求。

5 数据中心供配电系统智慧运维应用

5.1 供配电系统智慧监测及节能

数据中心供配电系统包含高压开关柜、变压器、低压配电柜、不间断电源或高压直流电源,以及末端配电箱等,设备多,且分布于数据中心不同功能间,日常运维难度大。

日常巡检周期比较长,这是因为数据中心供配电系统容量大,且拥有大量设备,主要采用多层配置方式,设备具有分散性特征,如采用人工巡检会产生大量维护预算。

大型数据中心供配电系统中包含较多的子系统,而且各个系统之间的联系较弱。

预警难度大,很难及时发现安全隐患。数据中心投产之后,运维人员若再采用传统手段判断系统状态,就无法发挥预警作用,供配电系统的可靠性得不到保障。

发生故障之后不能及时诊断故障,对恢复到正常的工作状态有影响。利用传统的供配电系统,因为设备数据监测采集监控系统不够完善,如果发生故障需要利用人工调试方式,需要耗费较多的时间排除故障,数据中心运行因此受到影响。

数据中心供配电系统智慧运维,需要在供配电各节点嵌入各种传感器、感应设备,并配置带通信功能智能化仪表,实现设备运行电压、电流、有功功率、无功功率、谐波等参数采集及记录;同时在数据中心监控室建设统一平台集成智慧监控系统,利用嵌入式人工智能技术,融合不同的智能组件和数字化功能,不仅可以提供供配电系统的基础功能,还可以发挥远程调度、故障诊断以及设备管理等作用。运行期间,各节点实时采集设备数据,并通过485线或光纤传送至后台,由监控系统紧密联系各链路设备运行参数,通过对比分析确定是否对应,判断某个节点是否存在故障;监控系统还可以通过对比分析数据库的历史参数,提早发现设备存在的隐患;同时供配电系统智慧运维系统还能记录分析数据中心供配电系统、空调系统各运行方式下能耗,综合考虑电网波峰波谷电价情况,为数据中心提出科学的节能运行方案,并通过对末端配电开关控制实现空调系统的合理运行,最终实现数据中心降低碳排放的目标。

5.2 中压智慧负载控制系统

当前大型数据中心的外市电主要采用中压多电源供电,中压系统运行要求如下:

10 kV采用单母线分段接线,正常运行状态两路外市电电源同时供电。

如果其中一路市电电源失电,需要断开故障电源的进线开关,并且闭合分段开关,利用另一路市电电源供本系统全部负荷。

如果两路市电同时失电,需要同时断开电源进线开关、分段开关及所有负载侧开关,闭合两路发电机电源开关,发电机启动稳定后,逐步闭合各负载侧开关。

恢复一路市电供电之后,市电/发电机切换开关断开发电机电源,转而投入市电电源,其次闭合分段开关,实现市电电源供电,并向发电机发出停机信号。

恢复两路市电供电之后,即可恢复正常运行模式。

中压配电常规微机综合保护装置可实现双电源互为备投功能,但大型数据中心供配电系统增加了中压发电机启动及切换功能,切换前还需提前关停数据中心大容量负载,避免发电机宕机损坏。如继续采用微机综合保护装置驱动各开关投切,需增加大量中间继电器组件各种运行逻辑关系,二次接线复杂,且会增加很多故障点,可靠性差。如出现故障导致多电源并入情况,可能会造成上级电网事故,运维人员的工作难度、工作压力也会因此增加。

在大型数据中心供配电系统运行过程中,需要中压系统具备及时投入后备电源能力,也要避免各回路电源出现并接事故,确保整个系统运行的稳定性和安全性。中压智慧负载控制系统采用可编程逻辑控制器,增强了中压系统二次设备的开放性、逻辑性、安全性,大大提升了数据中心智慧运维技术水平。中压智慧负载控制系统在接收中压系统市电电源状态、发电机并机系统状态信息并接入开关辅助触点信号后,由系统自动分析故障,利用流程化的模型手段,有效判断中压系统各点运行情况等,最后快速输出所需信号,驱动相应中压开关分合闸,满足数据中心供配电系统运行需求。

6、结束语

随着信息技术不断发展,需要进一步提升硬件设备智慧化和数据模型智慧化水平,进一步提高数据中心供配电系统智慧运维效率,同时降低整体成本,为无人化、自动化发展奠定基础。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oo0VE3sQQWHi9ke6W4tfRo4g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券