MIT提出FPGA加速机器学习推理,提速175倍轻松处理EB数据集

新智元原创

编辑:鹏飞

【新智元导读】由麻省理工学院助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队测试的新机器学习技术可以在眨眼间发现大型强子对撞机(LHC)海洋中的特定粒子特征。

MIT助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队正在测试一种新的机器学习技术,该技术可以在眨眼间在大型强子对撞机(LHC)浩瀚如海的数据中发现特定粒子特征。

新系统既复杂又迅速,可以在数据集不断变大变复杂的情况下,让我们得以一窥机器学习将在粒子物理学的未来发现中,会发挥怎样举足轻重的作用。

论文地址:

https://arxiv.org/pdf/1904.08986.pdf

机器学习成为攻坚利器

大型强子对撞机每秒造成大约4000万次碰撞。筛选如此大量数据,需要强大的计算机,来识别其中需要科学家去关注的碰撞,无论是暗物质还是希格斯粒子。

现在,费米实验室(Fermilab),欧洲核子研究中心(CERN),麻省理工学院,华盛顿大学和其他地方的科学家们已经测试了一种新的机器学习系统,与现有方法相比,该系统可将处理速度提高30到175倍!

传统方法目前每秒只能处理不到一个图像。相比之下,新的机器学习系统每秒最多可以查看600张图像。在训练期间,系统学会挑选出一种特定类型的后碰撞粒子模式。

哈里斯说:“我们所识别的碰撞模式,顶夸克是大型强子对撞机上探测的基本粒子之一。能够分析尽可能多的数据非常重要,每一条数据都带有关于粒子如何相互作用的有趣信息。“

等目前的LHC升级完成后,数据将以前所未有的方式涌入;到2026年,17英里的粒子加速器预计将产生20倍于目前的数据,同时图像也将以比现在更高的分辨率拍摄。总而言之,科学家和工程师估计大型强子对撞机所需的计算能力是目前的10倍以上。

哈里斯继续说道:“未来的挑战迫在眉睫,随着计算变得更加准确,以及探测出更加精确的效果,它变得越来越难。”

该项目的研究人员对他们的新系统进行了训练,以识别顶夸克的图像,这是最庞大的基本粒子类型,比质子重180倍。

“通过我们提供的机器学习架构,就能够获得高质量的科学质量结果,与世界上最好的顶夸克识别算法相媲美,”哈里斯解释说。“高速实施核心算法使我们能够灵活地在最需要的关键时刻增强LHC计算。”

EB级的数据集也能轻松处理

凭借大型数据集和高数据采集速率,高性能和高吞吐量计算资源是实验粒子物理计划的基本要素。这些实验在探测器技术的复杂性和粒子束的强度方面不断增加。

因此,粒子物理数据集的大小正在增加,就像处理数据的算法的复杂性一样。例如,大型强子对撞机(HL-LHC)的高亮度阶段,将提供比当前LHC运行多15倍的数据。

HL-LHC将以40 MHz的速率碰撞质子束,碰撞环境中每次碰撞的粒子数将是原来的5倍。

Compact Muon Solenoid(CMS)实验将针对HL-LHC进行升级,读取通道的数量将增加10倍。通过一系列在线过滤器,CMS旨在以5 kHz的速率存储HL-LHC碰撞事件。

这样的数据速率导致数据集的规模为EB级。未来的中微子实验,如深层地下中微子实验(DUNE)和宇宙学实验、平方公里阵列(SKA),预计将产生百亿亿字节的数据集。

大规模粒子物理实验面临着高吞吐量计算资源的挑战。在具有增强的并行化的专用硬件上新的异构计算范例,例如现场可编程门阵列(FPGA),能够提供具有极大潜在增益的解决方案。

机器学习算法在粒子物理中用于模拟,重建和分析中,不断增长的应用,自然地部署在这样的平台上。

实验证明,机器学习推理的加速即Web服务,代表了粒子物理实验的异构计算解决方案,只需要对当前计算模型的最小修改。

作为示例,我们重新训练ResNet50卷积神经网络,以展示LHC顶级夸克喷射标记的最先进性能,并应用ResNet50模型和中微子事件分类的迁移学习。

使用Microsoft的Project Brainwave来加速ResNet50图像分类模型,我们使用Brainwave作为云(边缘或本地)服务的实验物理软件框架实现了60(10)毫秒的平均推断时间,显示了一个因素导致模型推断延迟比传统CPU推断提高了30-175倍。

作为粒子物理计算模型的边缘或云服务,协处理器加速器可以具有更高的占空比,并且可能更具成本效益。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190825A0865N00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券