世界超算大会归来,浪潮刘军说底色全是AI

李根 发自 凹非寺 量子位报道 | 公众号 QbitAI

这是又一个“春江水暖鸭先知”的印证。

因为人工智能在全球范围内的持续火热,刘军和他的工作正在受到越来越广泛的关注。作为浪潮人工智能和高性能服务器产品部总经理,刘军是那批最先知道AI计算力需求和产品化升级的人。

实际上,“AI Frist”早已通过业务部门更名体现。在今年4月,刘军所领导的团队,正式从浪潮集团高性能产品部,改名为人工智能和高性能服务器产品部。按照浪潮内部的判断来:超算和人工智能的融合,已是毋庸置疑的趋势。

不过,即便已经有过这样的心理准备,在置身前不久2017国际超级计算大会的现场时,刘军还是被法兰克福展现的一切引得心胸激荡、感慨万千。

在表述这种现场印象时,他说这次一次AI为底色的前所未见的超算大会——即便去年人工智能专家吴恩达现场分享,超算和AI,也从未有过如此强烈且明确的融合。

除此之外,在分享2017国际超级计算大会法拉克福现场观感之余,刘军还向量子位讲诉了业内正在发生的一些潜在不同,比如首次跌出超算前三的美国,可能正在用另外的方式看超算、AI和云。

“云计算”也是法兰克福的又一重要风向标。刘军告诉量子位,今年AWS和百度云都在现场布置了展台——从记录来看,这是历史性的举动。

当然,连续多年参与世界超算大会,并见证了中国军团在超算竞技领域的8连冠,刘军也以一个连续亲历者的身份,向我们分享了更多世界超算大会见闻感受,以及这些表象背后硬件技术趋势的看法。

人工智能和高性能服务器产品部总经理刘军

以下为量子位与刘军对话实录(经量子位编辑整理):

AI成超算世界大会底色 超算和AI融合加速

量子位:这次在法兰克福现场,印象最深刻的是什么?

刘军:感受最深的莫过于AI,毫不夸张地说:AI是这次超算世界大会的底色,超算和AI的融合也在加速。

量子位:议程上看,这次专门设立了AI Day,以前发生过类似的主题日吗?

刘军:是的,这次专门设立了一个AI Day。这也是我第一次听说为一个主题专门设置主题日进行展示和讨论,也是显示了大家对这事情非常重视。

实际上,这也是对超算正在发生的趋势的体现,比如在行业排名靠前的超算机器中,看到了绝大多数以GPU为代表的机器,其中日本研发的Cubumi,实际使用了GPU的Klast,构建了这样一个Klast。所以他把他命名为日本的 AI computer,就是日本的AI超级计算机。

这也是高性能计算和AI融合的一个表现。之前中间有很长一段时间,GPU在HPC上的日子并不好过,大家都要去很辛苦地改代码,而且被采纳的热情也不高。但现在AI又把GPU重新带回来了,而且日本人还专门以此为切入点,做了一个AI超级计算机,这可以看做AI+HPC的融合。除了Cubumi,日本人还自己立了一个项,说要做一个130P的AI超算。

量子位:这属于个例?还是现场可以感知到的行业共识?

刘军:我觉得日本可能走得稍微极端一点,但其他国家的团队都有这个共识。

像IBM也是这样的,IBM现在在推Power AI解决方案,实际上也用在IBM给美国国防部做的Summit机器,这个Summit机器如果今年下半年出来,峰值性能可能会超过250P,有可能超过我们的神威-太湖之光。

而Power处理器解决方案,使用的就是英伟达Link GPU来作为计算节点。所以它这个设计原本是给大规模HPC系统设计的,但现在也同样变成了适用于AI计算的超算,这在方向上跟日本人的是一致的。

今年浪潮也带去了类似的产品,我们在GTC发布的AGX2,再搭配英伟达的Link×100,就能同时兼顾AI计算性能和传统科学工程计算需求。好多客户对这个产品感兴趣,我们也在讨论这个解决方案,因为他们希望我们在给解决方案的同时,能够覆盖到传统HPC和AI计算的需求,这就要求我们不仅要在硬件上,还要在软件支撑、管理系统、应用的模式上,都把这种融合趋势结合起来。

量子位:所以这次2017国际超级计算大会的副主题其实就是AI?

刘军:对,这次感受非常深刻的就是到处在讲AI,整个AI和HPC融合的趋势越来越明显。比如IBM的展台,基本都在讲IBM的AI和Deep Learning的一些解决方案,告诉客户自己可以帮助他们如何去实现AI应用。

另外,Cray这样的厂商,原本做大规模科学工程计算的厂商,但今年也在讲HPC上面怎么跟数据分析,能够结合使用提供一个AI计算的平台。

最后,大会现场很多workshop、报告,也都在做AI在神经网络、深度学习和HPC结合方面的探讨。

量子位:这是从未有过的情况?

刘军:之前没有如此大规模的、整体底色为某一种技术趋势的大会。即便是在2016年,吴恩达到了现场做主题报告,也有一些AI领域的大咖过来,也没有今年如此火热,去年更像是开胃菜,今年每个展商都在展示自己的AI方面的产品,从产品来看也是前所未有的大爆发。

所以我整体感受是,这是关键性的一年,可能会让一些更大的事情发生,现在大家都在做这方面的准备,以及很深入很慎重的思考。

美国超算排名掉出前三引思考

量子位:这次世界超算比赛中国完成了8连冠,意外吗?

刘军:这次对结果不意外,一切很顺理成章。现在基本上从国内ASC到全世界较量的ISC,作为背后支持方和推动方,我们认为已经逐步建立起了信心。无论从中国比赛水平的挑战性,到相关队伍的能力,我认为现在我们都达到了全球顶尖,所以从ASC开始,无论是ISC还是SC,都会表现稳定、出色。

此外还有个幕后的小细节,这次中国参赛的两支队伍,一支清华、一支北航,他们在4月刚刚结束了ASC的比赛,实际中间用来准备ISC的只有一个多月的时间,其中还有准备机器、办理签证等各种各样的事情,最后还能以如此出色的成绩夺冠,可以试想背后的实力。

量子位:不过谈到实力,这次公布的全球超算TOP500中,美国第一次掉出了前三。

刘军:对,这是AI话题之外令人印象最深刻的地方,让人感到意外,也在现场引发了讨论,大家认为可能跟美国对超算的未来思考有关。

这次排名,第一名(中国神威-太湖之光)没变、第二名(中国天河二号)也没变,但第三名被瑞士超算中心的机器拿到了,美国的泰塔变成了第四名。

令人意外的主要是这几年来泰塔没太多实质动作,距离泰塔上一次夺冠已经5年了,期间它接连被中国赶超,现在被瑞士赶超,所以会让人更关注美国对于超算是不是有一些新思考。

当然,现在美国对超算也不能说没有部署,毕竟现在有Summit、Cliae和Orbloli,这都是性能在200P左右的机器。

但就在ISC2017会议开始前的周五,DOE发布了一个计划,称2.58亿美元支持六家公司做exascale研发,然后每家公司再一比一匹配研发经费,这背后可能让大家比较关注的是exascale研发涉及的新架构。

在新架构和一些应用需求方面,包括Deep Learning等AI的技术会不会对美国的下一代E级超算机器的设计、技术路线产生影响,就会变得格外引人关注。

我个人认为,美国人现在来思考这个问题,可能也是觉得如果继续按原来的技术路线走,那无外乎堆一个大机器出来,路线可能越走越窄,所以开始在有意识收缩一些漫无目的的资金投入,这方面可以明显感受到,依靠美国DOE生存的Cary公司,现在状况在变得困难,整个盈利能力都在下降。

所以美国这次全球超算排名跌出前三,可能背后的场面变化比台前表现更令人关注。其中涉及到不少对未来的思考,牵扯到新的体系结构,涉及AI和HPC的融合会对下一代超算产生的影响等。

这一点上,日本人比美国人干得更激进,已经一马当先了。他们直接号称自己做的超算机器是最绿色的AI超级计算机,不过日本在核心工作上感觉积累有限,下功夫的还是“绿色”之类的旁系,不像中美在核心硬机器上发力。

不过即便如此,这些涉及“AI”的动作,还是会让从业者产生很多思考,比如美国现在很多实验室,也在推出传统大型操作上面支持Deep Learning之类的,这就会带动更多人去想:下一代一级超算,是不是也要支持AI?怎么支持?怎么去做这些工作?

AI大背景或加速超算与云融合

量子位:这次听说百度和亚马逊等互联网公司也都去布展了?

刘军:对,这算是第三个令我印象深刻的见闻,就是HPC和云的融合,这次百度和亚马逊都是“云计算”方面的布展,而Cray也开始谈提供HPC One Cloud的服务,这算得上不小的改变,因为Cray之前大部分业务都是给客户做大定制和大机器,现在则转身说提供云服务。

你当然可以理解为面临经营挑战不得不作出的改变,但也要看到这可能是客户市场提出的需求——越来越客户正在思考,自己的业务什么时候开始上云、如何结合。

原来HPC和云结合,可能主要是基因这块,之前美国有30%-40%的深入基因研究的客户,在使用AWS做这样一些工作。

所以现在随着AI跟云结合的速度加快,也在带动HPC跟云结合的速度加快。之前是一些小客户做一些小训练,会直接在云端用AI服务,方便又快速,于是在进一步把新业务往云端迁移的时候,或许就会对再在线下建大规模HPC系统产生新思考:还有必要建这么大的机器吗?如果能都往云上去的话,是不是需要从结构上、系统上对行业有新的思考?

总结起来的话,AI带来的融合可能还不止于HPC和AI加速融合本身,可能也要把云和HPC融合考虑在内,这对下一代超算机器如何造,有非常重要的影响。所以我认为,今年往后应该会有比较大的事情、改变发生。

量子位:所以今年对超算行业来说,可能会是关键性一年,甚至是里程碑的一年?

刘军:我认为会是非常关键的一年,接下来应该会有较大的事情发生,我们通过现在行业里的思考和布局就知道,而且这些思考都是非常慎重认真的思考。

接下来还有在美国举行的AC大会,那时候规模会比现在大一些,到时候是不是这些预热性的思考会进一步落地,我们可以拭目以待。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-07-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

网易领投,AxonVR获VR触感技术领域最大融资额——580万美金

374160
来自专栏大数据文摘

快讯 | Facebook援非,开设Machine Learning项目

Facebook宣布支持非洲数学科学研究院(African Institute for Mathematical Sciences (AIMS))设立“非洲机器...

11230
来自专栏DT数据侠

用数学思维,打破数据悖论 | 数据科学50人·吴明辉

吴明辉,明略数据、秒针系统创始人兼董事长,本科毕业于北京大学数学学院,北京大学人工智能实验室硕士。他从事软件工程开发和算法研究近二十年,是国内企业级服务领域里全...

11620
来自专栏Python中文社区

进入新加坡互联网公司是种怎样的体验?

中国人在海外工作,已不是什么新鲜的话题。 优秀的工程师,不受限制地在另一个国度工作,也已不再是常青藤学校学生的特权。 2016.8,为了帮助国内最好的互联网人才...

55060
来自专栏云计算D1net

云计算环境下IT人的职业选择

三年以前,思科承诺将只解决云服务以外的各种云计算问题,作为其全面的云战略的一部分。它不希望与客户形成竞争关系。 但现在,思科宣布将在两年内投入10亿美...

30030
来自专栏程序员的知识天地

华人第一打工皇帝,程序员如何逆袭成为人生赢家

1961年,陆奇出生于上海,打小读书就非常努力。并且考上复旦大学,还成为复旦“本科毕业考上研究生的八十人之一”。成绩优异的他硕士毕业后选择就留校当了老师。

30710
来自专栏IT派

最新|图灵奖获奖者姚期智:中国AI弱点在系统和理论!

在最近播出的综艺节目《机智过人》里,清华大学交叉信息研究院院长姚期智的出现让不少观众惊喜而又惊讶。世界著名计算机科学家、图灵奖创立以来首位亚裔获奖者、世界现代密...

43850
来自专栏云市场 精选汇

华歌智能家居选择云翌通云总机平台让客户尽享智慧优越体验

华歌是全球领先的智能家居端到端解决方案提供商和云服务运营商。旗下拥有专注于别墅豪宅市场的高级定制品牌DVACO Lifestyle®,专注主流家庭市场的个性化定...

11220
来自专栏腾讯高校合作

CNCC 2017 | 专访清华胡事民教授:来CNCC,了解计算机一切领域前沿

前不久第十四届中国计算机大会(CNCC 2017)筹备会在京举行。近日雷锋网采访了CNCC 大会程序委员会主席,在计算机图形学领域的知名学者胡事民教授。 胡事民...

38560
来自专栏大数据文摘

政治是暂时的,方程是永久的——中美数学大师巅峰对话

236160

扫码关注云+社区

领取腾讯云代金券