前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【技术解密】比美国超算快5倍,神威凭何登上全球超算榜首

【技术解密】比美国超算快5倍,神威凭何登上全球超算榜首

作者头像
新智元
发布2018-03-27 13:36:51
1.2K0
发布2018-03-27 13:36:51
举报
文章被收录于专栏:新智元

【新智元导读】最新一期全球超级计算机TOP500榜单今日公布,中国自主研发制造的神威太湖之光取代天河2号名列第一,这个消息立即刷爆朋友圈。中科院计算所研究员、中国计算机学会青年计算机科技论坛(CCF YOCSEF)主席韩银和第一时间给出点评:

“太湖之光为啥这么牛?它拥有一颗巨强的“芯”-申威26010,上海高性能IC设计中心设计的国产高性能处理器。该处理器包含有260个处理核,单片峰值性能为3.06Tflops/s。天河-2单节点采用2个Intel Ivy Bridge处理器+3个Intel Xeon Phi类GPU加速器芯片,这5个处理器芯片峰值性能相加约为3.431Tflops/s,也就是说一颗申威芯片性能大致相当于天河-2中Intel 5个芯片的峰值性能之和!”

韩银和还总结了太湖之光的3个亮点:(1)总性能93P,比天河-2又快了3倍,比第3名美国橡树岭实验室的机器快了5倍,是第一台性能接近100P的机器;(2)采用了全国产众核处理器;(3)能效比达到6GFlops/W, 和Green500第一的日本机器能效比也就差不到10%,但太湖之光比日本机器规模大多了,这么大个头能效比控制的这么好,需要有独到的技术。

6月20日,第 23 届高性能计算(HPC)国际顶尖会议 ISC2016 在德国法兰克福举行,会上提前公布第 47 次 HPC TOP500 榜单,中国的神威太湖之光系统(Sunway TaihuLight System)排名第一。

神威太湖之光系统

在国家超级计算无锡中心1000平米的主机房内,整齐排布着两组共40个运算机仓,每个机仓容纳1024个芯片,共计40960个芯片。据介绍,其单芯片的计算能力相当于3台2000年全球排名第一的超级计算机,当前性能指标达到国际领先水平。

3 大突破

神威太湖之光由国家并行计算机工程技术中心研发,在无锡国家超算中心安装完成,2015年12月21日完成整机系统性能测试,目前由清华大学负责运营。

神威太湖之光运算峰值为 125.4 Pflop/s,持续性能 93 Pflop/s,比天河 2 号快了将近 3 倍,比排名第 3 的美国橡树岭实验室的机器快了 5 倍,也是国际第一台性能接近 100P 的机器。

美国Titan、天河二号、太湖之光参数对比

神威太湖之光每瓦特浮点运算次数达到了 6 亿次(世界排名第 2 到第 6 的超级计算机,这个数值都在 2 亿次左右),也即能耗比达到 6 Gflops/W,与 Green500 第一的日本机器相差不到10%,但太湖之光规模明显更大,因此实现的技术独到。目前,世界排名前 10 的其他超级计算机能耗比都在 2 Gflops/W 左右。

国家超级计算无锡中心主任杨广文教授在接受《人民日报》采访时表示,神威太湖之光一分钟的计算能力相当于全球72亿人同时用计算器不间断计算32年。

杨广文说:“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威太湖之光’实现了层次化、全方位的绿色节能,功耗比达到每瓦特60.51亿次运算。”

世界TOP6超级计算机参数

中国“芯”,No Intel Inside

ISC TOP500 榜单每年公布两次,根据超级计算机基准程序 LINPACK 测试值,评选全球最强超级计算机。

虽然我国处理器设计制造起步较晚、基础薄弱,但通过近十年政府支持和大力投入,目前我国在超算领域已经处于世界领先水平,也是继美国、日本之后,第 3 个研发出超级计算机的国家。

位于广州国家超级计算中心、由国防科技大学建造的天河 2 号,2013 年 6 月以 33.86 Pflop/s 的 LINPACK 测试值夺得TOP500 第一,并在接下来的 6 次榜单中蝉联冠军。

过去几年,中国工业和研究部门注册提交的系统数量剧增,中国现在入榜的超级计算机数量达到167台,超过美国的165台

这也是TOP500榜单美国入围的超级计算机总数量首次跌下第一位。

1993年至今中国TOP500超级计算机数量

1993年至今美国TOP500超级计算机数量

但由于天河 2 号采用了英特尔处理器,2015年4月,美国宣布对中国禁售高性能处理器。

这次,神威太湖之光使用我国自主研发和制造的 CPU 处理器——申威 26010(SW 26010),采用众核+CPU架构,含有将近 1065 万个内核,主内存 1.31 PB。

申威260140芯片

搭载了两个核心组的电路板

SW 26010的芯片由上海高性能集成电路设计中心研发,含有 4 个核心组,每组含有 65 个内核,由64个计算核心(CPE)、一个管理核心(MPE)和一个内存控制器构成。

神威太湖之光核心组示意图

64个计算核心排列为8x8的矩阵。4个内存控制器总共提供了136.5GB/s的带宽。

每组内部有自己的专属内存空间,组间通过片上网络(NoC)进行通讯。片上网络还连接着系统接口(SI),供芯片同外部设备通讯。

神威太湖之光架构示意图

神威太湖之光专为提升运算速度设计,简单的架构正是它运算速度胜过其他高能耗 HPC 系统的原因。

不过,申威芯片采用定制64位指令集,频率处于中等水平(1.45GHz),而且每个核心只能执行一个线程(不支持超线程),软件支持也没有Intel那么丰富。

但尽管如此,中国凭借一个完全基于中国设计、制造的处理器打造的新系统,在国际TOP500组织第47期榜单上保持第一,TOP500声明中这样写道。

实现零的突破

除了TOP500,戈登贝尔奖(Gordon Bell Prize)也是世界关注的重点。

戈登贝尔奖被喻为 HPC 应用领域的诺贝尔奖,每年颁发一次,授予 HPC 领域杰出表现应用,旨在记录变形计算发展趋势,尤其是奖励高性能计算创新应用。获奖应用多为性能峰值最高,或在可扩展性方面取得特殊成就,或缩短及重大科学或工程问题时间。

2016年的6项提名中,神威太湖之光占了一半,分别涉及大气、海洋、材料三个领域的应用:一个完全隐藏的非静力动态解算机,用于云分解大气层模拟;一个高效的全球表面波,用超高的分辨率进行数值模拟;大规模的相场模拟,用于基于Cahn-Hillard方程的粗化动力,加上减少的移动性。

过去24年至今,世界排名第一的超级计算机

加速人工智能

航空航天、石油勘探、车船设计、军事应用、新药研发、生物信息、气候模拟……超级计算广泛应用在从实体经济到战略领域的诸多方面。因此,超级计算不仅仅是学术研究,也涉及国家政治问题。

HPC 是世界各国竞相角逐的科技制高点。

神威太湖之光采用中国自主设计和研发的芯片,在超算领域树立了新的标杆,在美国 X86 之外建立了新的生态,可以说中国有了自己的产业链,未来还可能向其他国家输出。

不仅如此,HPC 也是人工智能技术尤其是机器学习发展的关键之一,众所周知,训练神经网络除了数据,还需要巨大的计算能力。

神威太湖之光在 HPC 领域的成功,定能极大推动我国智能产业发展。

接下来,中国制造的神威太湖之光,将为全球提供超级计算服务。

图片来源:www.netlib.org/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档