人工智能如何增加探寻新粒子的能力?

在寻找新基本粒子过程中,物理学家们总要对粒子行为做出假设,新机器学习算法却没有假设这一阶段。大型强子对撞机(LHC)每秒能撞击10亿对质子,偶尔还会产生出一些足以震惊现实的新东西。但由于这些随机出现的事件本身就是一个惊喜,物理学家们也不知道该去寻找什么信息。在将数十亿次碰撞数据筛选成更易于管理的数据过程中,物理学家担心无意中删除了新物理学的证据。纽约大学粒子物理学家凯尔克兰默在欧洲核子研究中心的阿特拉斯实验中说:我们总是担心“把孩子和洗澡水一起倒掉”。

今年四月大型强子对撞机内部的碰撞展示了单个带电粒子(橙色线)和大粒子射流(黄色圆锥体)。图片:ATLAS Experiment 2018 CERN

面临智能数据减少的挑战,一些物理学家正在尝试使用一种叫做“深度神经网络”机器学习技术(人工智能)来从如海洋一般的常见事件中检索新物理现象。在典型用例中,深度神经网络从一堆标记为“猫”和“狗”的照片中学会了区分猫和狗,但这种方法并不适用于寻找新粒子。因为物理学家们无法给机器提供未曾见过的事物照片。因此他们把研究方向转向“弱监督学习”,即机器从已知粒子出发,利用更少的颗粒信息寻找罕见事件,比如它们可能发生的频率。

今年5月发表在《arxiv》的一篇论文中,三位研究人员提出了一种相关策略以扩展“撞击搜寻”,这一技术用于搜索希格斯玻色子经典粒子。据劳伦斯伯克利国家实验室的研究员本纳克曼(论文作者之一)说:这一技术最终目的是训练机器在数据集中找出罕见的变化。把猫和狗作为一个小型例子,并且试图在北美森林观测数据集中发现一种新物种。假设任何新动物都有可能会聚集在某个地理区域(这个概念对应于围绕某个质量聚集的新粒子),该算法应该能够系统地比较邻近区域来识别它们。

如果不列颠哥伦比亚省恰好有113头驯鹿,而华盛顿州只有19头(即使在数百万松鼠的背景下也是如此),该项目将学习如何从松鼠中对驯鹿进行分类,而无需直接研究驯鹿。俄勒冈大学理论粒子物理学家蒂姆也研究了弱监管,这并不是魔术,但感觉就像变魔术一样神奇。相比之下,粒子物理学中的传统搜索通常需要研究人员对新现象做出假设。比如建立一个新粒子如何运动的模型:一个新粒子可能会衰变为特定的已知粒子群。只有研究人员定义了他们要寻找的东西之后,才能制定出相应的搜索策略。

这项任务通常至少需要花费博士生一年时间,纳克曼认为在某种情况下这项任务可以完成地更快、更彻底。CWoLa算法代表着无标签分类,可以搜索任何未知粒子的现有数据,比如该未知粒子衰减为两个较轻未知类型的相同粒子,或两个已知相同或不同类型的粒子。使用普通搜索方法,LHC至少需要20年的协作时间来排查后者的可能性,并且没有对前者进行搜索。但CWoLa可以一次完成所有的任务。

其他实验粒子物理学家也认为这一项目值得深入研究。ATLAS项目寻找新粒子碰撞物理学家凯特帕查尔说:我们已经研究了很多可预测区域,所以查缺补漏是下一研究的重要方向,去年与一些同事讨论了尝试设计一款能够处理一系列粒子质量灵活软件的想法,但没有人对机器学习有足够了解,但现在,是时候试试了。人们希望神经网络能够在数据中发现微妙关联,从而抵制当前的建模工作。其他机器学习技术已经成功地提高了大型强子对撞机的某些任务效率,比如识别由底夸克粒子构成的“喷流”。

这项工作无疑让物理学家们忽略了一些细节。加州大学欧文分校粒子物理学家丹尼尔怀特森说:把信息放在桌子上,但当你花100亿美元买一台机器时,你就不会想把信息放在桌子上。然而,机器学习中充斥着将手臂与哑铃混淆的程序警示事件;在大型强子对撞机上,一些人担心这些捷径最终会映射出机器自身问题,而实验物理学家们却煞费苦心地故意忽略了这一点。一旦有异常出现,它是新物理现象,还是探测器发生了故障?看到这,你有什么好想法呢?

博科园-科学科普|文:Charlie Wood/Quanta magazine/Quanta Newsletter

博科园-传递宇宙科学之美

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180826A0KM6R00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券