【GPU称霸超算TOP500最新榜单】美国重夺全球超算霸主,总算力56%来自GPU


新智元报道

来源:top500.org、nextplatform

编译:肖琴

【新智元导读】在近日举行的ISC会议上,最新Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,中国的神威·太湖之光排名第二。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。但在进入榜单的系统数量方面,中国仍然远超美国。

TOP500是针对全球已知最强大的计算机系统做出排名与详细介绍的项目。此项目始于1993年,今年已经是第25年。TOP500每年公布两次最新的超级计算机排名,一次是在6月份的国际超级计算机大会(ISC),第二次则是在11月份的全球超级计算大会(SC)。

近日举行的ISC会议上,最新一期Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,两个新系统进入前5。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。

Summit超级计算机。来源:橡树岭国家实验室

由IBM总包设计建设,目前在美国能源部(DOE)的橡树岭国家实验室(ORNL)运行的Summit超级计算机,在作为TOP500榜单基准的高性能Linpack(HPL)基准测试中以122.3 petaflops(每秒12.23亿亿次)的性能问鼎榜首。Summit超算有4356个节点,每个节点配备2颗22核的Power9 CPU和6颗NVIDIA Tesla V100 GPU。节点与Mellanox双轨EDR InfiniBand网络连接在一起。

Summit的Linpack测试的理论峰值性能是187.7 petaflops。在Linpack测试中,Summit超算提供122.3 petaflops的性能,计算效率达到65.2% ——这对新机器来说并不差,而且显然会随着时间的推移而改善。

排名第二的是中国的神威·太湖之光,由国家并行计算机工程技术研究中心(NRCPC)开发,安装在国家超级计算无锡中心。该系统在过去两年里一直名列榜首,自2016年6月上线以来,它的HPL成绩一直保持不变,为93 petaflops。神威·太湖之光在Linpack性能测试中的计算效率达到74.2%,达到93 petaflops的性能的功耗为15.37百万瓦(megawatts),而Summit系统达到122.3 petaflops性能的功耗仅8.81百万瓦。

美国能源部劳伦斯利弗莫尔国家实验室的新系统Sierra排名第三,它的HPL性能是71.6 petaflops。同样由IBM打造的Sierra超算的架构与Summit非常相似,有4320个节点,每个节点均由两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU驱动,并使用相同的Mellanox EDR InfiniBand作为系统互连。

天河二号尽管经过了一次重大升级,用定制的Matrix-2000协处理器取代了5年前的Xeon Phi加速器,但它还是下降了两名,由6个月前的第二名变成第四名。天河二号的新硬件将其HPL性能从33.9 petaflops提高到61.4 petaflops,同时将功耗略微提高了约4%。天河二号由中国国防科技大学(NUDT)开发,部署在国家超级计算广州中心。

AI Bridging Cloud Infrastructure (ABCI)是排名第五的系统,由日本富士通公司制造,它的HPL性能达到19.9 petaflops。ABCI由20核的Xeon Gold处理器和NVIDIA Tesla V100 GPU驱动,安装在日本国家先进工业科学技术研究所(AIST)。

瑞士的Piz Daint (19.6 petaflops)、美国的Titan (17.6 petaflops)、美国的Sequoia (17.2 petaflops)、美国的Trinity (14.1 petaflops),和美国的 Cori (14.0 petaflops) 分别排第6位至第10位。

TOP500的前10名

TOP500榜单中国超算数量超过美国

接下来我们看看TOP500的一些关键概况。

尽管美国在榜单上的排名靠前,但目前美国在榜单上的系统只有124套,创历史新低。就在6个月前,美国在榜单上的系统还有145套。与此同时,中国进入榜单的系统达到206套,占比41%,6个月前是202套。接着是日本,有36套系统,英国22套,德国21套,法国18套。这些数字与上次的榜单基本相同。

国家超算数量年度变化

不过,主要归功于Summit和Sierra,美国在性能方面从中国手中夺回了领先地位。目前,美国的系统占TOP500系统性能总和的38.2%,中国排在第二位,占29.1%。

今年是第一次TOP500榜单的所有500套系统的总性能超过百亿亿次级别(exaflop),确切地说,已经达到1.22 exaflops。这比去年11月时的 845 petaflops 要高。其中,有273套系统的HPL性能超过1 petaflops,而上次的榜单超过只有181套系统性能超过1 petaflops。

CPU架构Intel Xeon占主导地位,56%的计算来自GPU

就处理器架构而言,Intel Xeon在CPU架构方面占据主导地位。

未来几年,IBM和AMD可能会分别凭借Power和Epyc处理器迎来复兴,而Arm服务器芯片也将从中分得一杯羹。但即便如此,Intel Xeon仍将继续在CPU方面占据主导地位。

在加速器方面,TOP500系统中有110个使用加速器,相比2017年11月时的101个加速系统略有增加。TOP500超算的总体性能有一半来自某种形式的加速系统。这些使用加速器的系统中有96个使用NVIDIA GPU,其中前10名就有5个:Summit,Sierra,ABCI,Piz Daint和Titan。此外,使用加速器的系统中有7个配备了Xeon Phi协处理器,而PEZY加速器被用在4个系统中。另外20个系统使用Xeon Phi作为主处理器。

TOP500的几乎所有超级计算机(97.8%)都由拥有8个或更多内核的主处理器驱动,超过一半(53.2%)的主处理器有超过16个内核。

10G或更快的以太网在247个系统中被使用,比6个月前榜单的228个多。此外,139个系统使用InfiniBand,比上次榜单的163个少。有38个系统使用英特尔的Omni-Path技术,上次的榜单是35个。

TOP500榜单中,56%的计算来自GPU。越来越多的厂商开始谈论“人工智能超级计算机”(AI supercomputers),因为可以加速传统HPC工作负载的CPU-GPU混合架构也可以用于机器学习训练。

自1993年以来,TOP500的总性能、排名第一以及排名500的超算性能变化如下图所示:

另一个变化是,榜单中学术、机密和研究类型的超算有所减少,而用于工业的超算比例增加了:

以下是按系统份额的厂商排名,联系有122套系统上榜,占23.8%,其次是HPE,15.8%(79套系统),浪潮,13.6%(68套系统),Cray, 11.2%(56套系统),曙光, 11%(55套系统)。

尽管IBM拥有前三名超级计算机中的两款:Summit和Sierra,但它在整个榜单中只有19套系统。然而,由于这两台机器,IBM贡献了TOP500总性能的19.9%。接着是Cray,性能份额为16.5%,联想为12.0%,HPE为9.9%。

Green500榜单

最后,我们看一下Green500的榜单。Green500中排名前三的超算都来自日本,它们基于ZettaScaler-2.2架构,使用PEZY-SC2加速器。而前10名中的其他系统都使用NVIDIA GPU。

最高能效的超级计算机仍然日本理研的Shoubu(菖蒲) system B,能效为18.4 gigaflops/watt,在TOP500榜单中排名第362位。

能效排名第二的是位於日本高能加速器研究组织/KEK的Suiren2系统,达到16.8 gigaflops/watt,在TOP500榜单中排名第388位。

Green500的第三名是美国的DGX SaturnV Volta系统,接着是Summit(美国),TSUBAME 3.0(日本),AIST AI Cloud(日本),AI Bridging Cloud Infrastructure(日本),new IBM MareNostrum P9 cluster(西班牙),DOE’s Summit system(美国),以及Wilkes-2(英国)。

作为不依赖任何加速器的最高能效的超级计算机,神威·太湖之光在Green500榜单上排第22位。

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-06-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏钱塘大数据

理工男图解零维到十维空间,烧脑已过度,受不了啦!

让我们从一个点开始,和我们几何意义上的点一样,它没有大小、没有维度。它只是被想象出来的、作为标志一个位置的点。它什么也没有,空间、时间通通不存在,这就是零维度。

35230
来自专栏FSociety

SQL中GROUP BY用法示例

GROUP BY我们可以先从字面上来理解,GROUP表示分组,BY后面写字段名,就表示根据哪个字段进行分组,如果有用Excel比较多的话,GROUP BY比较类...

5.2K20
来自专栏腾讯社交用户体验设计

ISUX Xcube智能一键生成H5

51620
来自专栏怀英的自我修炼

考研英语-1-导学

英二图表作文要重视。总体而言,英语一会比英语二难点。不过就写作而言,英语二会比英语一有难度,毕竟图表作文并不好写。

12310
来自专栏Ken的杂谈

【系统设置】CentOS 修改机器名

18430
来自专栏腾讯高校合作

【倒计时7天】2018教育部-腾讯公司产学合作协同育人项目申请即将截止!

16220
来自专栏微信公众号:小白课代表

不只是软件,在线也可以免费下载百度文库了。

不管是学生,还是职场员工,下载各种文档几乎是不可避免的,各种XXX.docx,XXX.pptx更是家常便饭,人们最常用的就是百度文库,豆丁文库,道客巴巴这些下载...

44830
来自专栏前端桃园

知识体系解决迷茫的你

最近在星球里群里都有小伙伴说道自己对未来的路比较迷茫,一旦闲下来就不知道自己改干啥,今天我这篇文章就是让你觉得一天给你 25 个小时你都不够用,觉得睡觉都是浪费...

22440
来自专栏haifeiWu与他朋友们的专栏

复杂业务下向Mysql导入30万条数据代码优化的踩坑记录

从毕业到现在第一次接触到超过30万条数据导入MySQL的场景(有点low),就是在顺丰公司接入我司EMM产品时需要将AD中的员工数据导入MySQL中,因此楼主负...

30840
来自专栏钱塘大数据

中国互联网协会发布:《2018中国互联网发展报告》

在2018中国互联网大会闭幕论坛上,中国互联网协会正式发布《中国互联网发展报告2018》(以下简称《报告》)。《中国互联网发展报告》是由中国互联网协会与中国互联...

13750

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励