制造企业通过采用AI系统提高产品良品率,金融行业采用AI优化用户体验降低风险,物流企业利用AI提升配送效率,医疗行业采用AI不断提升诊疗效率……也许你并没有注意,但AI在的的确确快速深入应用到每一个行业。
今天,由机器学习支撑的人工智能技术创新为其应用提供了坚实的基础。算力的提升,算法的突破,数据的暴增均成为引爆AI产业发展的有利条件。为了加速AI运行效率,数据中心的存储和计算领域已经发生了巨大的技术变革,例如存储介质从机械硬盘演进到闪存盘,计算在采用GPU甚至专用的AI芯片,但同样作为三大核心IT基础设施的网络是否已经Ready了呢?
显然并没有,当前数据中心网络可以总结为三大挑战:
1. 传统以太网0.1%的丢包率已是常见,但它将导致AI算力只能发挥到50%;2. 数字洪水来袭,预计全球年新增数据量将从2018年的10ZB猛增到2025年180ZB,现有100GE的网络无法支撑;3. 计算网络、存储网络和数据网络逐渐融合,靠传统人工排查的运维手段定位故障需要数个小时,已难以为继。
所以,业界期待面向一个AI时代的数据中心网络,它又该是什么样子?2019年1月9日,华为给出了其心目中的答案:CloudEngine 16800!
从云时代的CE12800到AI时代的CE16800
“业界首款内嵌AI芯片的数据中心交换机,100%发挥AI算力;业界最高密度单槽位48 x 400GE,满足AI时代5倍流量增长需求;使能自动驾驶网络,秒级故障识别、分钟级故障自动定位”。CloudEngine 16800用这些独创的交换机网络特性,引领数据中心网络从云时代迈向AI时代。
自此,CloudEngine 16800成为华为CloudEngine系列数据中心交换机的最新旗舰之作。此前,这个旗舰“宝座”属于CloudEngine 12800。
事实上在6年前,CloudEngine 12800的面世代表着华为数据中心网络的传奇,其正交架构、前后风道、面板进风等领先设计理念引领了高密100G平台数据中心交换机的设计和技术创新潮流。在CloudEngine 12800发布后的六七年里,华为数据中心网络解决方案得到了业界的热捧,从2016年开始已经国内份额稳居第一,并以82%的复合增长率连续六年增速全球第一。
CloudEngine 12800是华为面向云计算时代推出的明星产品,现在这个接力棒交给了CloudEngine 16800,它为AI而生!
华为网络产品线总裁胡克文表示,CloudEngine 16800作为华为AI发展战略以及全栈全场景AI解决方案的一个重要组成部分,是业界首款面向AI时代的数据中心交换机,并支持高密400G接口,将重新定义数据中心网络的代际切换,助力客户使能和加速AI商用进程,引领数据中心进入AI时代。
三大特征描绘AI交换机的样子
从HUAWEI CONNECT 2018华为发布Ascend(昇腾)AI芯片并宣布AI战略开始,华为就将人工智能发展提到了前所未有的高度。自然,网络也成为其AI战略的重要一环。华为将人工智能技术创新性地应用到数据中心交换机,这在业内尚无先例。
在华为看来,数据中心需要一个自动驾驶的高性能网络来提升AI算力,帮助客户加速AI业务的运行。因此,如上文所说,华为定义了AI时代数据中心交换机的三大特征:内嵌AI芯片、单槽48 x 400GE高密端口、能够向自动驾驶网络演进。
这三大特征正是为满足数据中心网络的发展需求而推出,它也描绘出了一款AI时代数据中心交换机的样子:
1
业界首款内嵌AI芯片的数据中心交换机
“首款装上AI大脑的交换机”,这即是CloudEngine 16800与当前市场上所有的交换机最大的差异化设计。
CloudEngine 16800搭载了华为自研高性能AI芯片(昇腾),并承载独创的iLossLess智能无损交换算法,实现流量模型自适应自优化,从而在零丢包基础上获得更低时延和更高吞吐的网络性能。这些技术创新得以让CloudEngine 16800克服了传统以太网丢包导致的算力损失,将AI算力从50%提升到100%,数据存储IOPS性能提升30%。
2
业界最高密度单槽位48 x 400GE
在硬件平台上,CloudEngine 16800再次树立了业界标杆。CloudEngine 16800全面升级了硬件交换平台,实现单槽位48端口400GE线卡,整机768端口400GE的交换容量。
在多家厂商已经宣布推出400G交换机的今天,如果问CloudEngine 16800还有什么不同?华为交换机与企业网关产品线总裁钟开生直接说道,业界最高密度、业界最大交换容量就是CloudEngine 16800全新硬件平台的独特之处。CloudEngine 16800一台抵五台,交换能力达到业界平均的5倍,能够满足AI时代流量倍增需求。同时,单比特功耗下降50%,更绿色节能。
3
使能自动驾驶网络
提升智能运维水平和网络故障修复效率是CloudEngine 16800承继华为推动的意图驱动的智简网络(IDN)的理念延伸,从而使能自动驾驶网络加速到来。
得益于AI芯片,CloudEngine 16800可大幅度提升“网络边缘”即设备级的智能化水平,使得交换机具备本地推理和实时快速决策的能力;并且,通过本地智能结合集中的FabricInsight网络分析器,构建分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位;此外,基于iNetOps智能运维算法,华为提供了超过72种典型故障秒级根因分析的能力,使故障自动定位率达到90%。
CloudEngine 16800的更多黑科技
当然,作为一款划时代的数据中心交换机巨作,你可能认为CloudEngine 16800还缺点什么?其实还有很多,在CloudEngine 16800的设计中,华为突破了多项技术难题,以支持超高密度及其演进能力,包括超高速信号传输、超强散热、高效供电等黑科技,并显著降低了数据中心能耗。
1
SuperFast超高速互联
从100G到高密400G,首先考验的是信号高速传输能力,传统的电路板由于采用的普通铜箔材料及制造工艺问题,当信号传输速率提升时,损耗和高频干扰非常严重,存在速率极限。华为采用新型亚微米无损材料及高分子键合技术的制作工艺,将电信号的传输效率提升30%,满足100G到400G全生命周期兼容和能力演进。
2
SuperPower高效供电
华为提出业界首个双路输入智能切换的电源模块,采用磁吹灭弧和大励磁技术实现ms级快速切换,21个电源模块就可以实现原来40个模块所达到的供电能力和可靠性,电源空间节省50%。线路板上采用矩阵磁和高频磁技术,实现在两个拇指大小的空间内提供1600W供电能力,使得单位空间的供电效率提升90%。
3
SuperCooling超强散热
如此超高密度的交换机,散热是整机工程能力的一个重要体现。我们知道,所有的芯片都会产生热量,如何将这些热量散发出去是单板设计的关键,CloudEngine 16800采用独有的碳纳米导热垫和VC相变散热技术,散热效率较业界提升4倍,整机可靠性提升20%。再来看风扇技术,华为采用了业界首创的混流风扇,可以使得整机散热效率达到最佳,与业界相比,平均每bit数据的功耗降低50%,相当于每台每年节省32万度电,约合26万元电费,减少碳排放250余吨。
所以看得出,CloudEngine 16800不仅有大容量,而且有大智慧,不仅有软件上的智能无损交换算法和智能运维算法创新,还有硬件设计上的一个个黑科技。CloudEngine 16800的推出,无疑是华为持续进行研发创新的结晶。
华为GIV(Global Industry Vision)2025预测,企业对AI的采用率将从2015年的16%达到2025年的86%,AI成为企业重塑商业模式、助力决策和提升客户体验的关键推动力,因此数据中心从云时代向AI时代演进成为必然。
CloudEngine 16800为AI时代而生,6年7个月以来,CloudEngine 12800创造了云时代的数据中心交换机传奇,现在,CloudEngine 16800正在开启AI时代的传奇。
领取专属 10元无门槛券
私享最新 技术干货