在上一期的《液冷大咖说》栏目中,浙江吉利智算信息科技有限公司副总经理张国林,从吉利星睿智算中心应用的角度,就液冷技术相关的需求和发展,进行了交流,他认为“智算中心应用液冷 大势所趋”。
本文是《液冷大咖说》栏目的第五期,在本期视频中,益企研究院创始人张广彬(狒哥),从全栈数据中心的角度,分析了液冷方案在数据中心的应用需求和前景。
狒哥表示,从全栈数据中心的理念角度而言,液冷在整个数据中心全栈必然会走向深度融合,这是在算力密度大幅度提升背景下的总体大趋势。
只是由于液冷系统会增加数据中心整体的复杂度,因此非到必要不可的状态下,数据中心不会贸然引入液冷相关的系统,毕竟涉及到环境论证、工程和实践等各种问题。
随着人工智能这几年的飞速发展,GPU的发热量越来越高,单机柜的功耗密度越来越大,数据中心不得不引入液冷来解决相关的功耗挑战,而不仅仅是为了数据中心的省电和降低PUE这样的诉求。毕竟,空气是已经被长期验证过的介质,风冷也是长期以来数据中心最简单、易行的散热方案。
这也是目前市场上风冷和液冷共存的主要原因之一,甚至风冷还在占据主导地位。虽然液冷是一个整体趋势,但是如果数据中心的功率密度没有到达一定的水平,那么数据中心还是更愿意继续沿用风冷,而不是转向液冷方案。
当然,有一些数据中心为了应对功率密度挑战,已经在积极引入液冷技术和产品。有一些领先的公司推出的液冷方案,适配性很强,也非常灵活,可以在风冷方式和液冷方式之间做一定的自由选择。这种方案就非常符合目前的实际情况,而不是采用二极管思维,要么是风冷要么是液冷,其实风液应该是可以兼容的,甚至是可以灵活切换的。
此外,狒哥认为,从运维的角度来说,风冷目前还是优于液冷。毕竟液冷系统会带来更多的复杂度和运维挑战。
从全栈数据中心的角度来看,数据中心应该从芯片需求的角度出发,相对应的选择风冷或者液冷方案。在数据中心而言,作为GPU的领先企业,现在是英伟达在带领行业在液冷发展的方向上迈进,其越来越高算力和功耗的GPU,正成为液冷发展的关键驱动力。
谈及“冷却即服务”,狒哥认为在液冷时代,这是非常重要的。在风冷时代,数据中心主要考虑的是物理问题;在液冷时代,数据中心主要考虑的可能就是化学问题。化学问题就包括各种材料科学、材料的相容性、管路和液体的相容性等等。在浸没式液冷中,还需要考虑液冷的液体跟IT设备材料的相容性等问题。这在吉利智算中心等实际应用中也是屡屡被提及的挑战。
不能指望客户能够懂得所有的相关问题和解决方案,那么提供相关服务的厂商,就非常重要。客户想要享受好液冷的价值,那么服务商就必须有足够的能力。
对于企业来说,在算力提升的现状下,单机柜设备的价值正越来越高,企业必须注重服务的价值,尤其是液冷相关的服务,以保护机柜的设备不出问题。这是在液冷时代,大家必须重视冷却服务的根本原因。
领取专属 10元无门槛券
私享最新 技术干货