【论文】如何用机器学习解开银河系形成之谜

Brunner说,流体力学用来解释N体模拟给了宇宙学家更加精确的信息。但是使用流体动力学模拟时存在一个缺点:他们会占用数以百万计的超级计算时间,这对于研究来说是不能接受的。

“半解析模拟也会占用上千小时”Kamdar说,“我们的机器学习方法只会花费几分钟。”

伊利诺伊大学开发出一个新的机器学习模拟系统。它将会为宇宙学家提供一系列星系模型,这会为宇宙的形成提供更加精确和相关的信息。

这种方法的可行性在最近发表的两篇文章上被证明出来。这两篇文章由天文学家、物理学家同时也是统计学教授的Robert Brunner、他的本科学生Harshil Kamdar和美国国家超级计算机应用中心的研究科学家Matthew Turk撰写而成。

宇宙学家当前使用了两种模拟过程。第一种方法是N体模拟,主要是关于暗物质是如何在重力作用下塌陷的。这些模拟过程再加上半解析模型让天文学家模拟星系是如何形成的。第二种方法是流体力学N体模拟,它让天文学家直接模拟在引力塌缩下正常物质与暗物质相互作用形成星系;这种消耗大量计算的方法直接表明无法看到的暗物质团块,也被称为光晕,是如何影响恒星形成。

“暗物质形成了重力中的‘山谷’和‘丘陵’,气体粒子坠入‘丘陵’中”,Brunner说到,“他们最终会混合在一起通过一个所谓的流体动力学过程形成恒星,这是一个很复杂的过程,有点类似于我们的大气层”。

Brunner说,流体力学用来解释N体模拟给了宇宙学家更加精确的信息。但是使用流体动力学模拟时存在一个缺点:他们会占用数以百万计的超级计算时间,这对于研究来说是不能接受的。

“半解析模拟也会占用上千小时”Kamdar说,“我们的机器学习方法只会花费几分钟。”

机器学习使用了电脑算法来识别高维数据中的关系。Illinois团队开发了一个机器学习算法在流体力学模拟过程中把暗物质晕和他们的地位相当的正常物质对应起来。

机器学习先是使用算法在罕见的、上百万小时的流体力学模拟过程上训练,接着使用这个算法通过逼近研究人员想看的性质来节省计算时间。使用了流体力学N体模拟和半解析模型后,该团队发现虽然暗物质和例子的位置可能不准确,但是模型预测得到的星系的分布和相应的性质是几乎正确的。

“打个比喻就是,使用机器学习来预测班级中学生的成绩,我们不能正确的得到每个学生的成绩,但是成绩的分布是正确的。”Brunner说到。

在第一篇发表在《皇家天文学会月报》(MNRAS)的论文中,研究人员证明了机器学习能够重新创造出与半解析模型相似的星系的分布。在第二篇递交的论文中,现在在ArXiv上发布出来,他们比较了机器学习算法和流体力学模拟,将星系在粒子水平上进行比对,再一次发现机器学习方法表现优良。

他们将来的工作将会包括使用计算时间耗费少的的机器学习算法只模拟星系中的暗物质。这个新的机器学习框架将能够快速创造一个模拟的星系图来与观测结果比较。

这种新的方法为那些比较观测结果与模拟过程的研究人员提供了希望。这其中包括暗能量调查和即将到来的大型综合巡天望远镜,这两者均将纳入到Illinois大学的研究体系中。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-11-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

扫码关注云+社区