用于星系的人脸识别:人工智能为天文学带来新工具

【概要】名为“深度学习”的机器学习方法被广泛应用于人脸识别以及其他图像和语音识别应用程序,该方法在帮助天文学家分析星系图像及了解它们如何形成和演变方面展示了潜力。

在一项新研究中,科研人员使用计算机模拟星系的形成来训练深度学习算法,该算法随后被证实在分析来自哈勃空间望远镜(Hubble Space Telescope)的星系图像方面表现异常出色。这项研究的成果已发表在《天文物理期刊》(Astrophysical Journal)上。

科研人员利用来自模拟的输出结果生成被模拟星系的模拟图像,就像使用哈勃空间望远镜对其进行观测时看到的一样。模拟图像被用于训练深度学习系统,使其能够识别之前在模拟中确定的星系演变的三个关键阶段。科研人员随后为该系统提供大量真实的哈勃图像用于分类。

结果表明,神经网络对模拟星系和真实星系的分类具有高度一致性。“我们并没有指望它会如此成功。我对它的强大能力感到吃惊,”参与研究的乔尔·普里马克(Joel Primack)说道,他是加利福尼亚大学圣克鲁斯分校(UC Santa Cruz)物理学荣誉教授兼圣克鲁斯粒子物理研究所(Santa Cruz Institute for Particle Physics,SCIPP)成员。“我们知道模拟存在局限性,因而我们不想发表太过确定的主张,但我们不认为这只是好运气的意外收获。”

星系是复杂的现象,其外观会在数十亿年的演变过程中改变,而星系图像只能提供其在各个时间点的快照。天文学家可以更深入地观察宇宙,从而“回到过去”查看早期的星系(因为光在宇宙距离上传播所需的时间),但跟踪单个星系随时间演变的过程却只能通过模拟实现。将模拟的星系与观测到的星系进行比较可以揭示真实星系及其可能历史的重要细节。

1、蓝核

在这项新研究中,科研人员对富含气体的星系的早期演变模拟中发现的以下现象尤其感兴趣:当大量气体流入星系的中心时,星系的中心会形成一个小而密集的恒星形成区域,称为“蓝核”。年轻、炽热的恒星会发出“蓝色”短波长光,因此蓝色表示具有活跃恒星形成的星系,而较为衰老、温度较低的恒星则会发出更多的“红色”光。

计算机程序在模拟数据和观测数据中都有以下发现:“蓝核”阶段只在质量属于特定范围的星系中发生。中心区域的行星形成随后会平息,带来紧凑的“红核”阶段。质量范围的一致性是令人兴奋的发现,因为它表明深度学习算法正在自行确定真实星系中发生的重要物理过程的模式。

“这有可能是因为,在一定的大小范围内,星系刚好具有让这一物理过程发生的质量,”加利福尼亚大学圣克鲁斯分校天文学和天体物理学荣誉教授戴维·库(David Koo)说道。

科研人员使用了由普里马克和国际协作者团队开发的最先进的星系模拟(VELA模拟),这些协作者包括运行模拟的丹尼尔·塞韦里诺(Daniel Ceverino,海德堡大学)和领导模拟的分析和解释并据此发展出新物理概念的艾维沙·德克尔(Avishai Dekel,希伯来大学)。但是,所有此类模拟在捕获星系形成的复杂物理特性方面均能力有限。

需要特别指出的是,本研究中使用的模拟不包括来自活跃星系核(galactic nuclei)的反馈(中心超大质量黑洞吸收气体时,通过辐射注入能量)。许多天文学家认为这一过程是调节星系中恒星形成的重要因素。尽管如此,对遥远、年轻星系的观测似乎表明存在相关证据,可证实模拟中看到的导致蓝核阶段的现象。

2、CANDELS

对于观测数据,该团队使用了通过CANDELS项目(宇宙近红外超深空组合河外星系遗产巡天,Cosmic Assembly Near-infrared Deep Extragalactic Legacy Survey)获得的星系图像。该项目是哈勃空间望远镜有史以来规模最大的项目。第一作者马克·韦尔塔斯-孔帕尼(Marc Huertas-Company)是巴黎天文台(Paris Observatory)和巴黎第七大学(Paris Diderot University)的天文学家,他已经完成了使用公开可用的CANDELS数据将深度学习方法应用于星系分类方面的开创性工作。

CANDELS合作研究员库邀请韦尔塔斯-孔帕尼访问加利福尼亚大学圣克鲁斯分校来继续这项工作。谷歌通过向库和普里马克提供研究基金捐赠,为他们在天文学方面的深度学习工作提供支持,这让韦尔塔斯-孔帕尼得以在圣克鲁斯度过两个夏天,并计划在2018年的夏天再次来访。

“这个项目只是我们几个想法中的一个,”库说道。“我们想要挑选一个理论学家可以基于模拟明确定义的过程,并且这个过程应该与星系的外观有一定关系。然后,我们会让深层学习算法在观测中找到这一过程。我们刚刚开始探索这种新的研究方法。这是将理论和观测融合的新方法。”

多年来,普里马克一直与加利福尼亚大学圣克鲁斯分校的库和其他天文学家密切合作,将其团队对星系形成和演变的模拟与CANDELS的观测结果进行比较。“VELA模拟在帮助我们理解CANDELS的观测结果方面取得了很多成功,”普里马克说道,“尽管没有人拥有完美的模拟,但随着我们继续这项工作,我们将不断开发出更好的模拟。”

库表示,深度学习算法具有揭示观测数据中人类无法看到的方面的潜力。缺点在于该算法就像一个“黑匣子”,因而很难知道计算机使用数据的哪些特征进行分类。但网络询问技术可以确定图像中的哪些像素对分类贡献最大,科研人员已在其网络中对其中一种方法进行了测试。

“深度学习技术会寻找模式,而计算机可以发现因复杂程度太高而导致人类无法发现的模式,”库说道。“我们想要对这种方法进行更多测试,但在目前的概念验证研究中,计算机似乎成功地在数据中发现了模拟中确定的星系演变的不同阶段。”

他表示,在未来,由于大型巡天项目和新望远镜(例如大型综合巡天望远镜[Large Synoptic Survey Telescope]、詹姆斯·韦伯空间望远镜[James Webb Space Telescope]和广域红外巡天望远镜[Wide-Field Infrared Survey Telescope])的存在,天文学家将拥有更多可供分析的观测数据。深度学习和其他机器学习方法可成为理解这些海量数据集的强大工具。

“这是在天文学中使用高级人工智能的激动人心的阶段的开端,”库说道。

本文分享自微信公众号 - 人工智能快报(AI_News)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

能把晦涩难懂的研究工作讲清楚,Distill就奖你10000美刀

Root 编译整理 量子位 出品 | 公众号 QbitAI 在机器学习研究圈里,大家可能都有这样的赶脚: 大部分从事机器学习研究的人,不太擅长写作,无法清晰地呈...

34860
来自专栏算法channel

例子 3 个语言分析的基本任务

假如你的公司发布了一款全新的手机产品,新产品的发布带来了来自不同媒体的相关报道、用户反馈。 面对这些数据,你可能希望了解

14920
来自专栏大数据文摘

机器也有品味:谷歌最新算法让街景图具有专业摄影师审美

18620
来自专栏量子位

NLP如何入门?这里有一份经典资源汇总

允中 编译整理自 Medium 量子位 出品 | 公众号 QbitAI 自然语言处理入门该上什么课,看什么书,有哪些工具可用?Medium作者Melanie T...

36840
来自专栏专知

机器学习是“炼金术”?

19260
来自专栏AI科技评论

【深度】Nature:我们能打开人工智能的“黑箱”吗?

编者按:人工智能无处不在。但是在科学家信任人工智能之前,他们首先应该了解这些人工智能机器是如何运作的,这也就是文中所提到的“黑箱”问题。在控制论中,通常把所不知...

38060
来自专栏新智元

【中国脑计划与众神计算】AI芯片大航海时代,打造新一代脑模拟计算系统

【新智元导读】3月11日,北京脑科学和类脑计算论坛召开,以“众神(经)计算”为主题,由中科院计算所研究员孙毓忠首次提出,众专家分析讨论,探索用于脑科学和脑疾病的...

60490
来自专栏新智元

从马文·明斯基到AlphaGo,人工智能走过了怎样的70年?

从19世纪中叶人工智能的萌芽时期,到现今人工智能的重生,从马文·明斯基到AlphaGo,历史上发生了哪些激动人心的故事?本文以此铺展人工智能发展近70年来...

35850
来自专栏PPV课数据科学社区

批评文:大数据,大安利

最近在社会上刮起一阵大数据的不正之风,本科生也敢拿着几个G的硬盘声称这些数据能解决某某疑难问题,让人联想起存满硬盘黄片的处男说这家伙老爽了。 虽然在社会科学领域...

31380
来自专栏新智元

对于 tractable tasks,机器学习很难胜过专家

我们 “语义计算” 群在讨论这个句子的句法结构:The asbestos fiber, crocidolite, is unusually resilient ...

30050

扫码关注云+社区

领取腾讯云代金券