【业界】程序员也是天文学家?利用机器学习寻找行星

今天,借助望远镜光学、太空飞行、数码相机和计算机等技术帮助,我们有可能探测其他恒星周围的行星。但发现系外行星并不容易。所以我们最近使用了机器学习技术。

几千年来,人们一直仰望星空,记录观察报告,发现行星运行轨迹。早期天文学家通过夜空中看似不规则的运动,发现其中的行星,希腊人称之为“planētai,”或“流浪者”。几个世纪的研究帮助人们了解地球和太阳系中其他恒星围绕太阳运行的轨迹。

今天,借助望远镜光学、太空飞行、数码相机和计算机等技术的帮助,我们有可能将我们的理解扩展到太阳系之外,并探测其他恒星周围的行星。研究这些被称为系外行星的行星有助于人类对宇宙进行深层次的探索。外面还有什么?还有其他的行星和太阳系吗?

尽管技术可以帮助搜索,但发现系外行星并不容易。相比他们的宿主恒星,行星的光芒非常小和黑暗,就像探照灯旁边飞着的萤火虫一样,难以发现…远在数千英里之外。但是在机器学习的帮助下,我们最近取得了一些进展。

天体物理学家寻找太阳系外行星的主要方法之一是通过同时使用自动软件和人工分析NASA开普勒任务的大量数据。开普勒观测了大约20万颗恒星,历时4年,每30分钟拍摄一次,创造了大约140亿个数据点。这140亿个数据点转化为大约2千万亿可能的行星轨道!即使对于最强大的计算机来说,如此大量的信息分析也是一个非常费时费力的过程。为了使这个过程更快更有效,我们转向机器学习。

当一颗绕轨道的行星阻挡了一些光线时,恒星的测量亮度会略有下降。开普勒太空望远镜观测了20万颗恒星的亮度,4年来一直在寻找这些由凌日行星造成的特征信号。

机器学习是教授计算机识别模式的方法,它在理解大量数据方面特别有用。核心观点是让计算机以实例来学习,而不是用特定的规则来编程。

我是一个对空间感兴趣的谷歌人工智能研究员,花费20%的时间在这项工作上(Google有可以有20%的时间内处理自己感兴趣的事情)。在这个过程中,我联系了来自UT Austin的天体物理学家Andrew,合作。我们把这项技术应用到天空中,并教机器学习系统如何识别遥远恒星周围的行星。

使用超过15000个标记开普勒信号的数据集,我们创建了一个TensorFlow模型来区分行星和非行星。为了做到这一点,它必须识别由实际行星引起的模式,而不是由其他物体如星斑和双星所引起的模式。当我们用以前从未见过的信号测试我们的模型时,它正确地识别出哪些信号是行星,哪些信号不是,正确率达到96%。所以我们知道它成功了!

开普勒90i是已发现的第8个围绕开普勒90恒星运行的行星,它成为我们已知的第一个8星系统。

用我们的工作模型,我们拍摄了恒星,用它来寻找开普勒数据中的新行星。为了缩小搜索范围,我们研究了已知的670颗恒星,其中包括已知的两个或更多的系外行星。在此过程中,我们发现了两个新的行星:开普勒80g和开普勒90i。值得注意的是,开普勒90i是第8颗环绕开普勒90恒星运行的行星,这使它成为了除我们自己之外的第一个已知的8行星系统。

我们使用了15,000个标记的开普勒信号来训练我们的机器学习模型来识别行星信号。我们用这个模型在670颗恒星的数据中寻找新的行星,并且发现了之前搜索中漏掉的两个行星。

关于我们新发现的星球的一些有趣的事实:它比地球大30%,表面温度大约800°F,不适合人类生存。它的运行周期是14天,这意味着你每两周就会有一个生日。

到目前为止,我们用模型搜索了20万颗恒星中的670颗。在开普勒数据中可能还有许多未发现的系外行星,新的想法和机器学习等技术将有助于在未来的许多年里推动天体的发现。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2017-12-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

薛定谔的滚与深度学习中的物理

【新智元导读】作者从薛定谔的“滚”讲到世界的量子性、神经网络的最大似然等等,用颇具趣味的方式呈现了深度学习中无处不在的物理本质。 最近朋友圈里有大神分享薛定谔的...

3025
来自专栏人工智能快报

用于星系的人脸识别:人工智能为天文学带来新工具

【概要】名为“深度学习”的机器学习方法被广泛应用于人脸识别以及其他图像和语音识别应用程序,该方法在帮助天文学家分析星系图像及了解它们如何形成和演变方面展示了潜力...

902
来自专栏量子位

ImageNet这八年:李飞飞和被她改变的AI世界

李杉 安妮 编译自 QZ 量子位 报道 | 公众号 QbitAI ? 2006年,李飞飞开始考虑一个想法。 当时刚刚出任伊利诺伊大学香槟分校计算机教授的她发现,...

4196
来自专栏AI科技评论

微软为什么要用英伟达的GPU来支持CNTK?

今天下午,在北京举行的GTC CHINA 2016(GPU技术大会)中,英伟达深度学习研究院对CNTK中图像识别功能进行了简单介绍。 首先,我们来了解下CNTK...

2553
来自专栏机器人网

一图向菜鸟解释机器学习、数据挖掘

随着数据科学在人工智能发展中大放异彩,数据挖掘、机器学习进入了越来越多人的视野。而对于很多人来说,诸如机器学习之类的名次听起来是神乎其技,但其真正的内涵却不为一...

2697
来自专栏人工智能快报

人工智能极大提升天文数据处理速度

引力透镜效应是指空间中一个遥远天体的图像(如星系)被大质量天体的引力扭曲和放大,例如一个星系群在一个较小、遥远天体的前面就会引发这种效应。这种有用的现象能帮助科...

2838
来自专栏AI2ML人工智能to机器学习

一个Oracle软工眼中的AlphaGo

有个90后叫"Andrey Kurenkov", 目前是Oracle 圣何塞的一名软件工程师, 这个小哥,年纪青青, 已经写了两部史书了。

581
来自专栏新智元

【SIGGRAPH 2017】山东大学陈宝权团队等用水做 3D 重建

【新智元导读】中国山东大学陈宝权教授率领北京电影学院未来影像高精尖创新中心和山东大学研究团队,联合以色列、加拿大的研究人员,提出了一种新颖的 3D 物体形状重建...

2713
来自专栏新智元

【重磅】Nature子刊 | 增强学习强化,混合脑生化鼠“走迷宫”能力大幅提升

【新智元导读】浙江大学吴朝晖课题组的研究人员日前在 Scientific Reports 发表论文,描述了一种结合了小鼠和增强学习算法计算机的混合脑机系统,结果...

3328
来自专栏华章科技

三角形的内角和等于180°?不对!

导读: “三角形内角和等于180°”,这对于我们来说是再熟悉不过的一个常识,陈省身教授从一个不同的角度去看待这个问题,并将这个问题延伸推广,于1944年,找到了...

602

扫描关注云+社区