首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

英特尔:以全栈能力提升真正的算力 拥抱HPC蓝海

面对E级计算的挑战,英特尔显得信心十足。

“你拥有的算力并不代表你的算力就是能被使用的计算能力。对超算中心很多用户来说,更重要的是你能帮他解决问题。从英特尔很长的历史来看,在英特尔的软件或硬件架构上做优化,会使最终用户的应用使用起来更加有效,这是我们在过去这些年来的强项之一,我也希望我们可以继续这样去帮助客户”—— 英特尔公司数据中心事业部副总裁兼E级计算业务总经理Trish A. Damkroger

在日前举办的HPC China 2019大会上,我有幸采访到了英特尔公司数据中心事业部副总裁兼E级计算业务总经理Trish A. Damkroger,从如上Trish以“客户为中心”这样的业务心态可以看出,英特尔秉持一直以来对科技产品的高要求,从客户需求出发,不断推动创新,对于未来的发展充满了自信。

Trish与我之前采访过的那些“老英特尔人”不同,她加入英特尔的时间只有两年多,但是在此之前她一直工作于美国劳伦斯利弗莫尔国家实验室,并担任计算主任一职。美国劳伦斯利弗莫尔国家实验室隶属于美国能源部,其研究的重点包括能源、健康、环境等多个领域。而在加入英特尔之后,Trish的主要工作则包括了E级计算和云计算两部分,其中E级计算是整个行业面临的问题,Trish的职责则是找到面对能耗墙、通信墙等技术障碍的方法;而在云端,Trish也致力于推动超算应用的服务化,即从单纯的产品购买升级为整体的服务支持。

多年来,英特尔在HPC领域一直处于行业领先的地位,而伴随着AI时代的逐渐到来,特别是深度学习和机器学习应用的崛起,使得加速计算成为了一种新的架构模式,也让英特尔意识到多种计算能力的重要性。至强融核处理器就是英特尔在处理器之外的另一种尝试,但在面对NVIDIA Tesla的竞争中,英特尔却并没有表现出如中央处理器领域那样明显的优势。

相对于计算来说,网络也是HPC应用的关键,特别是低延迟的属性尤其被客户所看重。在这个领域中,InfinBand的认同度相当高,而英特尔在多年前购买的Qlogic网络如今也变成了Omni-Path,但是就在不久前,有消息说英特尔决定停止对Omni-Path网络的后续研发,这也就意味着Omni-Path已经止步于100Gbps。

“停止研发是出于怎样的考虑?”,我问Trish。在追求不断进步、性能翻倍提升的今天,在InfinBand网络已经升级到200G乃至400Gbps的今天,英特尔这样的做法显得有些让人琢磨不透。联想到之前至强融合处理器的不了了之,我对于Omni-Path的前景也充满了担忧。

“我们认为Omni-Path已经足够好了,因为大概95%-98%的应用用不到100G以上的带宽。从总体拥有成本角度来说,Omni-Path是非常有竞争力的”,Trish表示。诚然,即便是对于InfinBand网络来说,带宽也并非绝对的优势,低延迟才是。不过就这样止步于100G,始终让人觉得有点怪怪的。最重要的是,100G如何来面对未来的E级计算时代?在所有人都恨不得再有三五倍性能提升的时候,100G肯定无法满足未来的需求。

“对于E级计算机,我们将采用Cray公司的Slingshot互联技术”,Trish说。说起Cray这家公司,许多国内的网友都很陌生,的确作为超级计算机的鼻祖,Cray更多专注于HPC领域,并且在每届TOP500榜单中都有不错的成绩。Slingshot技术就是它独家的网络技术,官方数据显示这种技术相对于传统技术来说可以带来5倍的性能提升。如此看来,英特尔之所以放弃Omni-Path,并非是像至强融核处理器那样“愿赌服输”,而是朝着更高的目标迈进了。

当然,说到至强融核处理器,目前英特尔也正在规划它的替代产品——Xe独立显卡。关于这款产品的消息其实早在去年业内就有不少传言,特别是在原AMD显卡研发负责人Raja Koduri加盟英特尔之后,更是坐实了这些消息。而按照计划,明年我们将看到Xe独立显卡的上市,它很大一部分价值就是对抗其他类型的GPU加速卡。

“Xe是专门针对计算的加速器,就像Nervana是针对AI加速的一样,也是我们很重要的一个产品线。所在通用市场当中,我们希望做最简单的、最适用的产品,而Xe产品也将应用于美国首台E级超级计算机——A21当中”。记得当年,英特尔也对曾经的至强融合处理器信誓旦旦,而如今Xe又被英特尔寄予厚望。

同样被寄予厚望的还有英特尔的存储架构,Trish团队目前研发的DAOS存储产品就是面向E级计算应用的模块之一。所谓DAOS的全称叫做分布式异步对象存储,它 是一种开源的软件定义对象存储,专为大规模分布式非易失性内存 (NVM) 而设计。DAOS 利用存储类内存 (SCM) 和 NVM express (NVMe) 等下一代 NVM 技术,并提供键值存储接口以及事务非阻塞 I/O、可在商用硬件上实现自我修复的高级数据保护、端到端数据完整性、精细的数据控制和弹性存储等特性,可优化性能和成本。

在本次大会上,Trish进行了一场主题演讲,并着重提到了英特尔在HPC与AI另一的6大优势。除了传统意义上我们认为的计算、存储、网络之外,英特尔在软件应用层面也进行了精心部署。这其中,英特尔还推出了名为oneAPI的统一编程模型,以简化跨不同计算架构的应用程序开发工作。

与硬件平台不同,oneAPI存在的最大价值就是为不同架构的开放者提供了统一的接口。按照英特尔的说法,无论是基于任何平台的系统,都可以通过oneAPI进行直接编程和API编程,并将提供统一的语言和库,可以在包括CPU、GPU、FPGA和AI加速器等不同硬件上,提供完整的本地代码性能。

如此看来,英特尔已经实现了在加速计算、网络、存储乃至于开发平台的全方位更新,面对即将到来的E级计算进行了全面升级,也让包括开发者在内的用户能够体验到最新科技带来的便捷与高效。不过问题在于,如果是Xe加速器、Slingshot互联技术亦或是oneAPI,都并非是眼下的原则。以oneAPI来说,这款产品预计在今年第四季度面向全球提供测试版,经过一年的丰富与完善之后,于明年年底正式推出。

作为大会的主办地,内蒙古历来有“天苍苍,野茫茫,风吹草低见牛羊”的美景,也流传着“千羊在望,不如一兔在手”的谚语。对于英特尔来说,未来的高科技固然好,但是客户更在意的是解决眼下的问题。特别是在云化HPC的今天,客户已经越来越不在意后台的计算设备来自何方,英特尔平台果然出色,但是包括ARM、POWER在内的其他平台,也未尚不可、

Trish对于这个问题的看法倒是相当乐观。在她看来,当下绝大多数软件都是针对x86平台所设计和优化的,所以x86在数据中心的主导地位也是毋庸置疑的。更重要的是,虽然其他平台也能提供不错的计算能力,但是如何将这些计算能力转化为切实的业务推动力,进而满足客户的需求,这中间还有很长的路要走。

笔者与Trish合影

而正如文章开头所引Trish的观点,拥有算力不代表可以使用算力,提高真正的计算力,软硬件结合为客户解决真正的问题,是英特尔的优势,同时也是推动行业发展的要点。

后记:面临国产化挑战,迎来AI新蓝海

即便面对着种种挑战,英特尔依然是数据中心无可争辩的领军者,它所指定的标准也引领着整个IT产业不断前进。尽管目前英特尔遇到了来自计算、网络等多个层面的挑战,但是它对于自身技术的信心从未改变。就中国市场来说,英特尔在商用领域依然有着不错的份额,市场反馈也很好。

不过在中国,英特尔却还面临着国产化的挑战。有消息称,中国政府计划在未来3年内实现新采购超算平台70%的国产化占比,这也意味着包括超算中心、科研院所在内的诸多党政机关和事业单位都需要采用国产化平台。

今年5月,科技部办颁发出第七块国家级超算中心牌照,郑州成为了这个幸运儿。而在这次HPC CHina 2019大会上,来自郑州超算的代表也分享了未来超算建设的规划(草案)。按照计划,明年郑州超算建设全部国产化的超算平台,其性能也将超过目前排名第一的神威太湖之光,跻身全国顶尖超算平台行列。

一直以来,超算领域都是关乎国计民生的重要领域,也是大国较量的焦点之一。今年6月,在持续的中美贸易摩擦下,美国宣布将中科曙光等公司列入“实体名单”,也说明超算竞争已经不仅仅拘泥于国家超算的层面(之前包括广州超算在内的多家超算中心已经“榜上有名”),更向着超算行业的解决方案提供商推进。在这样的条件下,中国政府要求超算国产化,也是大势所趋,顺势而为。

但对于以英特尔为代表的商业公司来说,这就意味着失去了这一领域的巨大市场。好在,当下的HPC与AI融合趋势越来越明显,在HPC市场萎缩之后,AI市场将成为行业新蓝海,互联网公司、智能公司等也将成为市场的采购主力。

祝福英特尔能够在新兴蓝海中再创佳绩,毕竟广阔天地,未来可期。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190830A0GNCV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券