专栏首页新智元【技术解密】比美国超算快5倍,神威凭何登上全球超算榜首

【技术解密】比美国超算快5倍,神威凭何登上全球超算榜首

【新智元导读】最新一期全球超级计算机TOP500榜单今日公布,中国自主研发制造的神威太湖之光取代天河2号名列第一,这个消息立即刷爆朋友圈。中科院计算所研究员、中国计算机学会青年计算机科技论坛(CCF YOCSEF)主席韩银和第一时间给出点评:

“太湖之光为啥这么牛?它拥有一颗巨强的“芯”-申威26010,上海高性能IC设计中心设计的国产高性能处理器。该处理器包含有260个处理核,单片峰值性能为3.06Tflops/s。天河-2单节点采用2个Intel Ivy Bridge处理器+3个Intel Xeon Phi类GPU加速器芯片,这5个处理器芯片峰值性能相加约为3.431Tflops/s,也就是说一颗申威芯片性能大致相当于天河-2中Intel 5个芯片的峰值性能之和!”

韩银和还总结了太湖之光的3个亮点:(1)总性能93P,比天河-2又快了3倍,比第3名美国橡树岭实验室的机器快了5倍,是第一台性能接近100P的机器;(2)采用了全国产众核处理器;(3)能效比达到6GFlops/W, 和Green500第一的日本机器能效比也就差不到10%,但太湖之光比日本机器规模大多了,这么大个头能效比控制的这么好,需要有独到的技术。

6月20日,第 23 届高性能计算(HPC)国际顶尖会议 ISC2016 在德国法兰克福举行,会上提前公布第 47 次 HPC TOP500 榜单,中国的神威太湖之光系统(Sunway TaihuLight System)排名第一。

神威太湖之光系统

在国家超级计算无锡中心1000平米的主机房内,整齐排布着两组共40个运算机仓,每个机仓容纳1024个芯片,共计40960个芯片。据介绍,其单芯片的计算能力相当于3台2000年全球排名第一的超级计算机,当前性能指标达到国际领先水平。

3 大突破

神威太湖之光由国家并行计算机工程技术中心研发,在无锡国家超算中心安装完成,2015年12月21日完成整机系统性能测试,目前由清华大学负责运营。

神威太湖之光运算峰值为 125.4 Pflop/s,持续性能 93 Pflop/s,比天河 2 号快了将近 3 倍,比排名第 3 的美国橡树岭实验室的机器快了 5 倍,也是国际第一台性能接近 100P 的机器。

美国Titan、天河二号、太湖之光参数对比

神威太湖之光每瓦特浮点运算次数达到了 6 亿次(世界排名第 2 到第 6 的超级计算机,这个数值都在 2 亿次左右),也即能耗比达到 6 Gflops/W,与 Green500 第一的日本机器相差不到10%,但太湖之光规模明显更大,因此实现的技术独到。目前,世界排名前 10 的其他超级计算机能耗比都在 2 Gflops/W 左右。

国家超级计算无锡中心主任杨广文教授在接受《人民日报》采访时表示,神威太湖之光一分钟的计算能力相当于全球72亿人同时用计算器不间断计算32年。

杨广文说:“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威太湖之光’实现了层次化、全方位的绿色节能,功耗比达到每瓦特60.51亿次运算。”

世界TOP6超级计算机参数

中国“芯”,No Intel Inside

ISC TOP500 榜单每年公布两次,根据超级计算机基准程序 LINPACK 测试值,评选全球最强超级计算机。

虽然我国处理器设计制造起步较晚、基础薄弱,但通过近十年政府支持和大力投入,目前我国在超算领域已经处于世界领先水平,也是继美国、日本之后,第 3 个研发出超级计算机的国家。

位于广州国家超级计算中心、由国防科技大学建造的天河 2 号,2013 年 6 月以 33.86 Pflop/s 的 LINPACK 测试值夺得TOP500 第一,并在接下来的 6 次榜单中蝉联冠军。

过去几年,中国工业和研究部门注册提交的系统数量剧增,中国现在入榜的超级计算机数量达到167台,超过美国的165台

这也是TOP500榜单美国入围的超级计算机总数量首次跌下第一位。

1993年至今中国TOP500超级计算机数量

1993年至今美国TOP500超级计算机数量

但由于天河 2 号采用了英特尔处理器,2015年4月,美国宣布对中国禁售高性能处理器。

这次,神威太湖之光使用我国自主研发和制造的 CPU 处理器——申威 26010(SW 26010),采用众核+CPU架构,含有将近 1065 万个内核,主内存 1.31 PB。

申威260140芯片

搭载了两个核心组的电路板

SW 26010的芯片由上海高性能集成电路设计中心研发,含有 4 个核心组,每组含有 65 个内核,由64个计算核心(CPE)、一个管理核心(MPE)和一个内存控制器构成。

神威太湖之光核心组示意图

64个计算核心排列为8x8的矩阵。4个内存控制器总共提供了136.5GB/s的带宽。

每组内部有自己的专属内存空间,组间通过片上网络(NoC)进行通讯。片上网络还连接着系统接口(SI),供芯片同外部设备通讯。

神威太湖之光架构示意图

神威太湖之光专为提升运算速度设计,简单的架构正是它运算速度胜过其他高能耗 HPC 系统的原因。

不过,申威芯片采用定制64位指令集,频率处于中等水平(1.45GHz),而且每个核心只能执行一个线程(不支持超线程),软件支持也没有Intel那么丰富。

但尽管如此,中国凭借一个完全基于中国设计、制造的处理器打造的新系统,在国际TOP500组织第47期榜单上保持第一,TOP500声明中这样写道。

实现零的突破

除了TOP500,戈登贝尔奖(Gordon Bell Prize)也是世界关注的重点。

戈登贝尔奖被喻为 HPC 应用领域的诺贝尔奖,每年颁发一次,授予 HPC 领域杰出表现应用,旨在记录变形计算发展趋势,尤其是奖励高性能计算创新应用。获奖应用多为性能峰值最高,或在可扩展性方面取得特殊成就,或缩短及重大科学或工程问题时间。

2016年的6项提名中,神威太湖之光占了一半,分别涉及大气、海洋、材料三个领域的应用:一个完全隐藏的非静力动态解算机,用于云分解大气层模拟;一个高效的全球表面波,用超高的分辨率进行数值模拟;大规模的相场模拟,用于基于Cahn-Hillard方程的粗化动力,加上减少的移动性。

过去24年至今,世界排名第一的超级计算机

加速人工智能

航空航天、石油勘探、车船设计、军事应用、新药研发、生物信息、气候模拟……超级计算广泛应用在从实体经济到战略领域的诸多方面。因此,超级计算不仅仅是学术研究,也涉及国家政治问题。

HPC 是世界各国竞相角逐的科技制高点。

神威太湖之光采用中国自主设计和研发的芯片,在超算领域树立了新的标杆,在美国 X86 之外建立了新的生态,可以说中国有了自己的产业链,未来还可能向其他国家输出。

不仅如此,HPC 也是人工智能技术尤其是机器学习发展的关键之一,众所周知,训练神经网络除了数据,还需要巨大的计算能力。

神威太湖之光在 HPC 领域的成功,定能极大推动我国智能产业发展。

接下来,中国制造的神威太湖之光,将为全球提供超级计算服务。

图片来源:www.netlib.org/

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【AI听】Hinton:反向传播要被彻底放弃了!Unity推出Machine Learning,24分钟训练ImageNet……

    主播 | 吴璇 选题 | 徐普 程炜 Heo 本周关键词 反向传播|Machine Learning Agents ImageNet|信息瓶颈 NO/1 Ge...

    AI研习社
  • Video ++孙兆民:人工智能行业报告——视频内容识别行业分析 | 分享总结 | 雷锋网

    像素的世界已经延伸到图像之外,虽然视频对于机器学习研究人员来说一直都是个挑战,但现在的技术能够使得从视频中提取信息变得跟从图像中提取信息一样简单。人工智能这个新...

    AI研习社
  • 【AI听】AlphaGo Zero实力碾压旧狗!世界首款人工智能芯片华为发布,英特尔新推Nervana神经网络处理器……

    本周关键词 Intel Nervana|华为Mate 10 AlphaGo Zero|吴恩达Woebot 主播 | 吴璇 ▼点击可听 \ 这里有你想知道的本周...

    AI研习社
  • Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字(附下载链接)

    本周,全球的计算机视觉专家们即将齐聚威尼斯参加 ICCV (International Conference on Computer Vision)2017,展...

    AI研习社
  • 玩机器学习要知道哪些开源数据库?

    开发 AI 和机器学习系统从来没有像现在这样方便。 类似于 TensorFlow、Torch 和 Spark 这样的开源工具,在 AI 开发者群体中已是无处不在...

    AI研习社
  • 微软携手亚马逊推出全新Gluon深度学习库,全面支持符号式和命令式编程

    AI研习社消息,继微软和Facebook联手发布ONNX开源生态标准,日前,微软和亚马逊又达成一致,携手发布Gluon深度学习库。 ? 据微软方面表示,Gluo...

    AI研习社
  • 超大规模云计算供应商重点投资人工智能云服务

    亚马逊网络服务(AWS)、微软、谷歌、IBM等公司在过去一年中增加了数十种云计算人工智能工具,并且具有不同程度的复杂性。这些平台是否选用这些工作负载取决于人工智...

    静一
  • ASM无法启动的问题分析(一)(r7笔记第87天)

    最近碰到了一个关于ASM无法启动的案例,当然这个案例比较长,准备分两篇来写。 问题的背景如下: 目前存在一套standalone的环境,采用了ASM作为存储管理...

    jeanron100
  • 【AI听】微软刷新了SQuAD记录!聊天机器人居然懂人类情感?谷歌大脑「神经网络优化器搜索」又双叒叕更新……

    本周关键词 SQuAD|聊天机器人 计算机视觉|谷歌大脑 主播 | 吴璇 NO/1 上周,微软又刷新了SQuAD记录... 今年7月,斯坦福大学发起的SQuA...

    AI研习社
  • 微软 Ignite2017 大会探秘,Azure 机器学习三大工具正式发布

    日前,微软 Ignite2017 大会正在美国佛罗里达州奥兰多举行,除了正式推出量子计算编程语言,对 Azure 云平台进行功能更新等,基于目前各大对手企业纷纷...

    AI研习社

扫码关注云+社区

领取腾讯云代金券