从海量数据中寻找未知

从海量数据中寻找未知(牧夫天文) 2018-09-28 07:33:37 牧夫天文 原文:http://www.astronomy.com/magazine/news/2018/09/seeking-the-unknown-in-cosmic-data 翻译:陆寅枫 校对:陈艳玲、陆寅枫汪荣鑫 本公众号系网易新闻·网易号“各有态度”签约账号 “ 在大规模巡天,公众科学,和机器学习盛兴的时代,天文学应该期待预料之外的发现。

澳大利亚平方千米阵探路者(ASKAP)。目前已知的射电源大概有二百五十万个,不过Ray Norris希望通过这些望远镜在天空中另发现七千万个左右。 Credit: SKA organization 1964年,天文学家阿诺·彭齐亚斯和罗伯特·威尔森在他们的观测数据中发现了奇怪的并持续出现的噪声,他们尝试寻找了潜在的错误辐射信号来源,甚至重新设计了望远镜的一部分,但都没能成功去掉它们。当一切方法看起来都不奏效的时候,他们赶走了已经在望远镜中筑巢的两只鸽子,清理了它们的排泄物,但噪声依然存在。他们当时不知道的是,他们试图去掉的“噪声”,其实是我们宇宙中最基本的信号——宇宙微波背景辐射(CMB)。 十年后,彭齐亚斯和威尔森因为宇宙微波背景辐射的偶然发现而获得了诺贝尔物理学奖。十年前的他们当时正在寻找银河系周围的光晕,但是他们最终却发现了宇宙发出的第一道光。 并不仅仅是彭齐亚斯和威尔森取得过这样偶然的突破。相反,意外的发现几乎已经成为天文学的标志了。威廉·赫歇尔在1781年寻找双星系统时发现了天王星,他最初还以为他看到的是一颗彗星。工程师琳达·谟拉比托为了更好地看到木星卫星后背景天空中的恒星,在调整照片对比度时发现了木卫一上的火山。物理学家卡尔·央斯基在试图改善跨大西洋电话质量的时候发现了从银河系中心发出的无线电波。60年代的一颗美国间谍卫星在寻找秘密核弹爆炸试验的时候发现了伽马射线暴。这样的例子数不胜数。 天文学的发展不仅依靠长时间以来理论和观测间的调解,也大大得益于意料之外的发现。过去二十年间,哈勃望远镜出色地完成了它最初的目标,但它同时也发现了环绕年轻恒星的电离原行星盘,揭开了暗能量的面纱,并且向我们展示了天空中看似漆黑空旷的区域其实也点缀着无数星系。当哈勃望远镜刚发射升空时,没有人会预料到这些发现。

1959年,贝尔实验室在新泽西州的霍尔姆德建造了15米霍尔姆德喇叭天线,它最初的目标是能够进行卫星通讯方面开拓性的工作。1964年,彭齐亚斯和威尔森就是用它发现了宇宙微波背景辐射。 Credit: NASA 随着科技的迅速发展,天文学进入了大数据时代。高分辨率成像技术和新的数据收集技术让天文学家能以前所未有的速度收集并储存大量的数据。他们往往会淹没在这些数据中而没有足够的时间去处理它们。所以,大数据天文时代需要一种处理数据的全新方式,而天文学家现在也正在努力改善他们的方法,希望能提高他们做出意料之外发现的机会。 翻遍每个角落 天文学中许多意想不到的发现都直接得益于新技术的发展。伽利略的望远镜让人们第一次能够以全新的角度观测天空,从而发现令人震惊的惊喜。几个世纪后,哈勃望远镜让天文学家能够更进一步的看入深空,揭露无法想象的奇妙现象。现在,天文学家雷·诺里斯将使用射电对宇宙进行一项新的调查。 宇宙演化图(Evolutionary Map of the Universe, EMU)项目使用澳大利亚平方千米阵列对夜空中的射电源进行研究。它的目标是结合深度和广度,在比之前任何尝试更广的视场中寻找更微弱的射电源。目前已知的射电源大概在二百五十万个左右,而EMU项目预期另发现七千万个。 射电源通常都位于最具活力和爆炸性的天体中。黑洞,超新星,脉冲星等都在向外发射无线电波。EMU项目期望能够通过发现大量早期宇宙中的天体来解释最初的恒星和星系是如何形成的。诺里斯已经花了许多时间来思考该如何实现那些意料之外的发现了。 “随着望远镜技术的进步,我们会收集到越来越多的数据”,诺里斯说,“问题的关键是发现那些你不曾预料的事情,那些藏在你所熟知的东西之中,数据噪点之后的事情。”

背景和仪器所产生的噪点,就像彭齐亚斯和威尔逊所熟知的那样,很难量化。随着望远镜等仪器变得越来越复杂,它们留在观测数据中的噪声信号也越来越难以理解。所以,区分异常的数据到底仅仅是噪声还是真正意料之外的发现的能力至关重要。 为了寻找这些意料之外的发现,诺里斯正着手于一个称为宽场异常值探测器(Widefield ouTlier Finder)的项目。这个探测器明确的目的便是使用云计算和复杂的算法,从海量的数据中筛选出异常值,有效地减少数据量。 寻找,就寻见 如果你找不到什么新的目标去观测,那就尝试看得比其他人都更仔细吧。当乔斯林·贝尔还是剑桥大学的一名研究生时,她被分配到一项研究类星体数据的任务。在众多信号数据中,她注意到有一个信号源变化的速率太快,不像是类星体。于是她便发现了脉冲星。 这种方法是许多研究的基础,例如大型综合巡天望远镜(LSST),它每隔几晚便将整个天空勘测一遍。 “所有人都相信LSST是寻找非常稀有的天体或天文事件的一场革命是有原因的”,LSST项目科学家eljko Ivezi说,“LSST勘测的量度,维度,和精度都是非常有益于发现稀有天体或天文事件的。”

一个典型的8米望远镜和经过特殊设计的LSST的视场宽度比较。 Credit: LSST Corporation; Astronomy: Roen Kelly LSST计划于2021年投入使用,届时起LSST将会向天文学家提供持续不断的详尽的巡天数据。LSST的宽场视野可以装下40个满月,在如此宽的视场中,LSST将会在从可见光到近红外的几个不同波段拍摄照片。每个天晴的晚上,LSST就会记录下超过30TB的数据。在它预计10年的工作时间中,它将对天空的每块区域进行超过一千次的拍摄,对大约四百亿天体进行超过三万亿(3×1012)次观测。 很显然,这种观测的方式会把那些亮度变化显著的天体区分出来,例如脉冲星,超新星,类星体等;同时,它也会把移动的天体给区分出来,比如小行星或是其他在我们太阳系中的小天体。科学家希望LSST还能找出除了这两种方式以外的变化。 大规模巡天以前当然也进行过,只是从未到达过LSST这种程度。在LSST之前,最大一次规模的巡天是斯隆数字化巡天(Sloan Digital Sky Survey, SDSS),但SDSS只对四分之一的天空进行巡天。和SDSS比起来,LSST使用的望远镜几乎要大三倍,分辨率高两倍,能探测的光谱波长范围也更大,并且目标是整个天空。 有了LSST如此高的数据收集效率,研究人员将可以依靠它在影像方面保持前列。为此,LSST的科学家们设计了一套系统,它可以自动地将两张不同时间拍摄的同一片天空的照片进行对比。并且该系统可以在一分钟内识别出两张图片中改变的部分。当然,找到哪里变化了是一回事,理解这变化背后的原因就是另一回事了,科学家仍需花上很多时间来做分析。 “我们需要这些工具有能力处理万亿数级的数据量”,Ivezi说,“现在我们的工具可以应对百万数级甚至十亿数级的天体数量,但是将这个能力提升一千倍绝对不是什么简单的事情。如果我们能做到这一点,或许我们将带来能够改变整个天文学格局的发现。” 『天文湿刻』 牧夫出品

火星北极边缘的冰崖 图片来源:NASA / JPL / ASU 谢谢阅读

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180928A0V2EY00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券