专栏首页新智元神威·太湖之光获戈登·贝尔奖,中国超算软硬兼施实现零的突破

神威·太湖之光获戈登·贝尔奖,中国超算软硬兼施实现零的突破

【新智元导读】北京时间今日凌晨 4:20 时许美国盐湖城 SC16大会上,我国自主研发的超算系统“神威·太湖之光”继日前蝉联TOP 500世界第一殊荣后,一举拿下高性能计算应用最高奖“戈登•贝尔奖”,实现了我国在该奖项上零的突破,成为中国高性能计算应用发展新的里程碑。

2016年11月17日(北京时间 18日凌晨4:20左右),美国盐湖城 SC16 大会上,我国全自主国产处理器构建的超级计算机“神威·太湖之光”,继不久前蝉联TOP 500榜单世界第一后,一举拿下“戈登•贝尔”奖,实现了我国高性能计算应用在此项大奖上零的突破,成为我国高性能计算应用发展的一个新的里程碑。

“戈登•贝尔”奖(ACM Gordon Bell Prize)设立于1987年,是国际高性能计算应用领域最高奖,由美国计算机协会(ACM)每年11月在美国召开的超算领域顶级会议(SC)颁发,旨在奖励时代前沿的并行计算研究成果,特别是高性能计算创新应用的杰出成就,被誉为“超级计算应用领域的诺贝尔奖”。与TOP 500着眼于高速计算硬件性能不同,戈登•贝尔奖更注重于高性能计算应用水平。美日研究人员凭借运行在美国“泰坦”超级计算机、日本“京”超级计算机上的应用,都曾经连续获得该奖项。而事实上,近30年来,该奖项一直被美国和日本垄断。

今天,中国终于打破了这一垄断!本次获奖表明,“神威·太湖之光”不仅多项指标世界第一,也可依托其强大的运算能力解算出世界一流的应用成果,未来更有能力开展实际大规模挑战性应用。

蝉联 Top 500 榜首,硬件指标世界第一

“神威·太湖之光”的名字在今年 6 月就刷爆过朋友圈,在第 47 次 HPC TOP500 榜单上,它取代天河2号,成为全球运算速度最快的计算机,也是世界上第一台性能接近100P 的机器。不仅如此,神威的上榜也让中国首次超越美国,成为入围 TOP500 超级计算机总数量最多的国家。

几天前,每年按例发布两次的 ISC TOP500 榜单再次公布,神威·太湖之光蝉联第 48 次 HPC TOP500 冠军

今年11月公布的第 48 届Top500 榜单,排名前十的超级计算机系统,神威·太湖之光继今年6月首次登顶后,蝉联榜首

TOP 500 评选注重高速计算硬件性能,神威·太湖之光的表现足以证明中国的超算运算能力。平台已经搭建好,只待在基础上开展深度研究,解决很多只有超算才能解决的重大科学与产业问题。

软件应用迎头赶上,戈登·贝尔奖实现零的突破

“戈登•贝尔”奖领奖现场

此次全球共有 6 项应用成果入围“戈登·贝尔”奖最终提名,其中 5 项都来自中国,几乎包揽了该奖项 2016 年全部提名。在这 5 项提名中,又有 3 项都是基于“神威·太湖之光”系统的全机应用:①“千万核可扩展全球大气动力学全隐式模拟”、②“高分辨率海浪数值模拟”、③“钛合金微结构演化相场模拟”。另外 2 项应用分别为国家海洋局海洋一所与清华大学合作的“高分辨率海浪数值模拟”,还有中科院网络中心的“钛合金微结构演化相场模拟”。

2016 年度的“戈登•贝尔”奖授予了基于“神威·太湖之光”的全机应用《千万核可扩展全球大气动力学全隐式模拟》,由中国科学院软件研究所、清华大学、北京师范大学、国家并行计算机工程技术研究中心,以及国家超级计算无锡中心的联合团队共同完成。

“戈登•贝尔”奖证书

该应用团队设计并开发了一种新的用于大气动力框架的高可扩展全隐式求解器,世界上首次在大规模异构系统上实现了高效和千万核可扩展的全隐式求解,并将模拟分辨率提升至500米以内,有望未来应用于全球高分辨率气候模拟和高精细数值天气预报。

该课题在应用与算法两个层面实现了重大突破:

  1. 应用层面,大气动力过程的模拟速度较美国下一代大气模拟系统(AM3,GFDL开发)的计算效率提升近一个数量级,全隐式求解方法是未来超高分辨率大气模式构建的一种新选择;
  2. 算法层面,实现目前世界上第一个可扩展到千万核,峰值效率超过 6% 的隐式求解器,较 2015 年“戈登•贝尔”奖工作在并行度和峰值效率均提升一个数量级。

国家超级计算无锡中心付昊桓副主任、甘霖博士与杨超研究员在获奖现场

国家超级计算无锡中心赴美人员获奖集体合影

本次荣获戈登·贝尔奖,是对“神威·太湖之光”开展实际应用课题的肯定。可以预见,“神威·太湖之光”将围绕世界重大科技需求,持续开展高性能计算应用服务,支持高性能计算发展战略及创新型国家建设,特别将在能源环境、先进制造等领域发挥重要作用。

获得“戈登·贝尔”奖,对中国超算意味着什么?

根据微信公众号“本来科技”赵广立报道《“神威”应用摘得“戈登·贝尔”奖!向世界证明中国超算不光拼速度》,超级计算机系统作为各国科技竞争力和综合国力的重要标志,是世界高技术领域的一个战略制高点。而使超级计算机系统真正发挥效用、为各领域提供高效计算服务,还是由高性能计算的应用发展水平决定。如果说超算设备和性能是各国高性能计算的硬实力,那么应用水平则象征着各国高性能计算的软实力。也就是说,各国卯足了劲儿发展高性能计算,不仅在于其战略地位,更在于其应用实效。

这些年来,中国超算取得的成绩有目共睹。“天河二号”、“神威·太湖之光”屡屡在性能指标上攀上世界之巅,我国在高性能计算机的数量和用户类型上也达到了前所未有的层次。然而却始终未能获得戈登·贝尔奖。

2014年的中国计算机大会专门召开专题论坛,聚焦“戈登贝尔奖离我们还有多远”。

因此,本次获奖消息比“神威·太湖之光”登顶世界超算500强更令人振奋!朋友圈里的大佬们都难掩激动!

超算界第一时间向团队表示祝贺

从另一个角度,高性能计算机系统研制水平的不断提高,最终的落脚点仍应是为了更好地使用其计算资源,并在此基础上产生更为广泛的成果和效益。“用好超级计算机甚至比研制超级计算机更难”已成为国内外业界共识。

诺贝尔评选委员会在2013年将诺贝尔化学奖授予美国化学家的“为复杂化学系统创立了多尺度模型”研究时就在声明中说:“对化学家来说,计算机是同试管一样重要的工具。”因此,如果只有计算机而不会用它,无异于空有宝刀而不能断朽木。

神威·太湖之光技术三大突破

今年 6 月,神威·太湖之光首次登顶 Top 500 榜首时,新智元就对此进行了报道。神威·太湖之光由国家并行计算机工程技术中心研发,在无锡国家超算中心安装完成,2015年12月21日完成整机系统性能测试,目前由清华大学负责运营。

神威·太湖之光使用我国自主研发和制造的 CPU 处理器——申威 26010(SW 26010),采用众核+CPU架构,含有将近 1065 万个内核,主内存 1.31 PB。

神威·太湖之光核心组示意图

64个计算核心排列为8x8的矩阵。4个内存控制器总共提供了136.5GB/s的带宽。

每组内部有自己的专属内存空间,组间通过片上网络(NoC)进行通讯。片上网络还连接着系统接口(SI),供芯片同外部设备通讯。

神威·太湖之光架构示意图

神威·太湖之光专为提升运算速度设计,简单的架构正是它运算速度胜过其他高能耗 HPC 系统的原因。

国家超级计算无锡中心主任杨广文教授 6 月份在接受《人民日报》采访时表示,神威·太湖之光一分钟的计算能力相当于全球 72 亿人同时用计算器不间断计算 32 年。

杨广文说:“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威太湖之光’实现了层次化、全方位的绿色节能,功耗比达到每瓦特 60.51 亿次运算。”

神威·太湖之光运算峰值为 125.4 Pflop/s,持续性能 93 Pflop/s,比天河 2 号快了将近 3 倍,比排名第 3 的美国橡树岭实验室的机器快了 5 倍,也是国际第一台性能接近 100P 的机器。

美国Titan、天河二号、太湖之光参数对比

神威·太湖之光每瓦特浮点运算次数达到了 6 亿次——目前,世界排名前 10 的其他超级计算机能耗比都在 2 Gflops/W 左右——也即能耗比达到 6 Gflops/W,与 Green500 第一的日本机器相差不到10%,但太湖之光规模明显更大,因此实现的技术独到。

世界排名第 2 到第 6 的超级计算机,每瓦特浮点运算次数都在 2 亿次左右

硬件、软件合力推动中国智能产业发展

《环球网》记者刘扬走访神威·太湖之光,文中提到中国超算的发展长久以来一直受到关注,但外界对于这个很烧钱的战略项目也有不少质疑,其中很重要的一个原因就是中国花大价钱造出了全球性能最好的超算,但在应用方面却“吃不饱”,甚至有用“十车道高速路上跑着很少的车辆”来形容中国超算性能与应用水平之间的关系。

11月,采用中国自主设计和研发的芯片的神威·太湖之光蝉联 Top 500 榜首,在超算领域树立了新的标杆,在美国 X86 之外建立了新的生态。而今,再一举拿下戈登贝尔奖,意味着我国超级计算应用软件研制水平和应用水平已得到显著提升。

以神威·太湖之光为代表的中国超级计算系统的崛起,也预示着中国智能产业的飞速提升。

资料来源:

  1. “神威•太湖之光”再传捷报——其应用成果荣获高性能计算应用最高奖“戈登•贝尔”奖,微信公众号“国家超级计算无锡中心”
  2. 赵广立,“神威”应用摘得“戈登·贝尔”奖!向世界证明中国超算不光拼速度,微信公众号“本来科技”
  3. 刘扬,《独家专访中国超算“掌门人”:揭开太湖之光之谜》,环球网

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-11-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 清华大学成功卫冕ASC18世界超算总决赛冠军,黑马上海科大斩获AI大奖

    新智元
  • 环球时报:超算排行榜,中国接连创纪录

    【环球军事报道】美国当地时间16日,在国际TOP500组织发布的世界超级计算机500强排行榜上,中国国防科技大学研制的天河二号再次位居第一,成为世界超算史上第一...

    新智元
  • 全球超算TOP500最新排名:搭载ARM日本超算Fugaku首次夺冠!中国超算总数实力霸榜

    最近,TOP500超级计算机排名最新出炉。日本超算Fugaku首次搭载ARM芯片夺冠!

    新智元
  • LeetCode 835. 图像重叠

    给出两个图像 A 和 B ,A 和 B 为大小相同的二维正方形矩阵。(并且为二进制矩阵,只包含0和1)。

    Michael阿明
  • 盘点2014年五大企业应用趋势:SAP和Oracle将放手一博云端战略

    如今企业应用的重点在于云,就连2014年较为流行的移动应用、嵌入式分析以及整合营销等都与云有着千丝万缕的联系。因为云有着能让所有用户都能参与的特点,各企业开始考...

    人称T客
  • Dubbo系列笔记之服务引用过程,不服不行

    写在前面:2020年面试必备的Java后端进阶面试题总结了一份复习指南在Github上,内容详细,图文并茂,有需要学习的朋友可以Star一下! GitHub地...

    用户5546570
  • BZOJ 3098: Hash Killer II(新生必做的水题)

    3098: Hash Killer II Time Limit: 5 Sec  Memory Limit: 128 MBSec  Special Judge S...

    Angel_Kitty
  • 3098: Hash Killer II

    3098: Hash Killer II Time Limit: 5 Sec  Memory Limit: 128 MBSec  Special Judge S...

    HansBug
  • BZOJ3098: Hash Killer II(构造)

    attack
  • opencv cudacodec VideoReader 报错

    这篇文章 https://blog.csdn.net/zijin0802034/article/details/83825081 提供了一个办法,复用例子里的代...

    shirishiyue

扫码关注云+社区

领取腾讯云代金券