前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >美国E级计算项目建立机器学习技术中心

美国E级计算项目建立机器学习技术中心

作者头像
人工智能快报
发布2018-08-17 13:34:56
4770
发布2018-08-17 13:34:56
举报
文章被收录于专栏:人工智能快报人工智能快报

美国正在推进的E级(百亿亿次级)计算项目建立了一个专注于机器学习技术的联合设计中心。

美国E级计算项目(Exascale Computing Project,ECP)建立了一个联合设计中心,将重点放在机器学习(ML)技术上。新中心名为ExaLearn,将针对科学和工程应用项目以及在ECP名下开展的其他工作开发百亿亿次级机器学习软件。具体而言,其目标是建立“可扩展且可持续的机器学习软件框架,让应用科学家和应用数学及计算机科学社区能够参与学习算法的联合设计。”

这项工作还将包括与美国能源部(DOE)的PathForward供应商合作,以帮助开发适用于各个硬件平台的软件,其中包括克雷(Cray)、IBM、英特尔、慧与科技(HPE)、英伟达和AMD正在开发的处理器及系统。

可扩展性是此类软件目前面临的最大限制之一。尽管最新的万亿次浮点运算GPU可以相当高效地运行机器学习代码,将应用程序扩展到为数不多的此类设备之外仍然是一项挑战。对于研究人员而言,将此软件用于百亿亿次级甚至千万亿次级运算在很大程度上是未知的领域。

尽管此机器学习软件的目标是未来的百亿亿次级系统,但值得注意的是,美国能源部的两台超级计算机Summit和Sierra已经可以在此种规模执行此类代码。Summit有能力提供超过300亿亿次浮点运算的深度学习性能,而Sierra可以提供约200亿亿次浮点运算的性能。两台计算机的性能都得益于其NVIDIA V100 GPU中的自定义Tensor内核。Summit已借此以188亿亿次浮点运算的性能运行比较基因组学代码。协同设计工作实际上做到了在无论使用何种底层硬件的情况下,都能够以与更传统的模拟和建模代码相同的方式为所有百亿亿次级超级计算机开发此类应用程序。

新中心的工作人员将包括来自与ECP合作的八个美国能源部核心国家实验室的研究人员和其他专家,即布鲁克海文国家实验室(Brookhaven)、阿贡国家实验室(Argonne)、劳伦斯伯克利国家实验室(Lawrence Berkeley)、劳伦斯利弗莫尔国家实验室(Lawrence Livermore)、洛斯阿拉莫斯国家实验室(Los Alamos)、橡树岭国家实验室(Oak Ridge)、西北太平洋国家实验室(Pacific Northwest)和桑迪亚国家实验室(Sandia)。布鲁克海文国家实验室计算科学计划副主任Francis J. Alexander(弗朗西斯·J·亚历山大)将成为这项工作的首席科学家。

亚历山大说道:“我们的多实验室团队对于能够有机会解决其中一部分最重要的百亿亿次级机器学习挑战感到非常激动。当然,私营部门已经在机器学习领域投入了大量资金。但是,要想推动我们在能源部开展的重要科学和国家安全工作,还有许多工作要做。我很高兴能够代表我们的协作团队负责这项工作。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能快报 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档