【业界】程序员也是天文学家?利用机器学习寻找行星

今天,借助望远镜光学、太空飞行、数码相机和计算机等技术帮助,我们有可能探测其他恒星周围的行星。但发现系外行星并不容易。所以我们最近使用了机器学习技术。

几千年来,人们一直仰望星空,记录观察报告,发现行星运行轨迹。早期天文学家通过夜空中看似不规则的运动,发现其中的行星,希腊人称之为“planētai,”或“流浪者”。几个世纪的研究帮助人们了解地球和太阳系中其他恒星围绕太阳运行的轨迹。

今天,借助望远镜光学、太空飞行、数码相机和计算机等技术的帮助,我们有可能将我们的理解扩展到太阳系之外,并探测其他恒星周围的行星。研究这些被称为系外行星的行星有助于人类对宇宙进行深层次的探索。外面还有什么?还有其他的行星和太阳系吗?

尽管技术可以帮助搜索,但发现系外行星并不容易。相比他们的宿主恒星,行星的光芒非常小和黑暗,就像探照灯旁边飞着的萤火虫一样,难以发现…远在数千英里之外。但是在机器学习的帮助下,我们最近取得了一些进展。

天体物理学家寻找太阳系外行星的主要方法之一是通过同时使用自动软件和人工分析NASA开普勒任务的大量数据。开普勒观测了大约20万颗恒星,历时4年,每30分钟拍摄一次,创造了大约140亿个数据点。这140亿个数据点转化为大约2千万亿可能的行星轨道!即使对于最强大的计算机来说,如此大量的信息分析也是一个非常费时费力的过程。为了使这个过程更快更有效,我们转向机器学习。

当一颗绕轨道的行星阻挡了一些光线时,恒星的测量亮度会略有下降。开普勒太空望远镜观测了20万颗恒星的亮度,4年来一直在寻找这些由凌日行星造成的特征信号。

机器学习是教授计算机识别模式的方法,它在理解大量数据方面特别有用。核心观点是让计算机以实例来学习,而不是用特定的规则来编程。

我是一个对空间感兴趣的谷歌人工智能研究员,花费20%的时间在这项工作上(Google有可以有20%的时间内处理自己感兴趣的事情)。在这个过程中,我联系了来自UT Austin的天体物理学家Andrew,合作。我们把这项技术应用到天空中,并教机器学习系统如何识别遥远恒星周围的行星。

使用超过15000个标记开普勒信号的数据集,我们创建了一个TensorFlow模型来区分行星和非行星。为了做到这一点,它必须识别由实际行星引起的模式,而不是由其他物体如星斑和双星所引起的模式。当我们用以前从未见过的信号测试我们的模型时,它正确地识别出哪些信号是行星,哪些信号不是,正确率达到96%。所以我们知道它成功了!

开普勒90i是已发现的第8个围绕开普勒90恒星运行的行星,它成为我们已知的第一个8星系统。

用我们的工作模型,我们拍摄了恒星,用它来寻找开普勒数据中的新行星。为了缩小搜索范围,我们研究了已知的670颗恒星,其中包括已知的两个或更多的系外行星。在此过程中,我们发现了两个新的行星:开普勒80g和开普勒90i。值得注意的是,开普勒90i是第8颗环绕开普勒90恒星运行的行星,这使它成为了除我们自己之外的第一个已知的8行星系统。

我们使用了15,000个标记的开普勒信号来训练我们的机器学习模型来识别行星信号。我们用这个模型在670颗恒星的数据中寻找新的行星,并且发现了之前搜索中漏掉的两个行星。

关于我们新发现的星球的一些有趣的事实:它比地球大30%,表面温度大约800°F,不适合人类生存。它的运行周期是14天,这意味着你每两周就会有一个生日。

到目前为止,我们用模型搜索了20万颗恒星中的670颗。在开普勒数据中可能还有许多未发现的系外行星,新的想法和机器学习等技术将有助于在未来的许多年里推动天体的发现。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2017-12-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

论买奶粉的正确姿势,文本数据挖掘有话要说

面对市场上玲琅满目的奶粉,消费者时常不知如何选择。作为一个擅长用数据解决消费问题的网红,DT君一向推崇用户评论文本数据的挖掘。来自KPMG大数据挖掘团队的数据侠...

580
来自专栏机器之心

纽约客特稿 | 把癌症诊断交给机器,医疗服务会更好吗?

选自Newyorker 作者:Siddhartha Mukherjee 机器之心编译 参与:侯韵楚、Rick R、微胖、吴攀、蒋思源 深度学习系统变得越强大,它...

32815
来自专栏量子位

AI能有多污?要看你喂它吃什么 | 怎样玩坏GAN

Robbie Barrat虽然刚刚高中毕业,但驾龄已经不短了。他日常给AI投喂各种各样的画作,然后让AI自己画。

561
来自专栏量子位

飙涨70倍!高端GPU在京东卖疯了,万元显卡为何分分钟抢光?

量子位 | 舒石 李林 发自 凹非寺 ? △ TITAN X Pascal在京东上很快销售一空 “信丨仰丨升丨级!” 今天午夜0点,英伟达(NVIDIA)TIT...

2363
来自专栏大数据文摘

视觉研究的前世今生(下)

2014
来自专栏人工智能快报

人工智能极大提升天文数据处理速度

引力透镜效应是指空间中一个遥远天体的图像(如星系)被大质量天体的引力扭曲和放大,例如一个星系群在一个较小、遥远天体的前面就会引发这种效应。这种有用的现象能帮助科...

2888
来自专栏机器之心

业界 | DAC 2018目标检测系统挑战赛落幕:中科院、清华分获GPU与FPGA组冠军

无人机在工业、农业、军事及消费级市场均有如土地测绘、巡检监测、物资配送、灾后救援等重要作用。其中,实现高精度且高能效物体检测是开展所有无人机任务的基本要素,也是...

952
来自专栏林欣哲

10 分钟看懂新型市场预测平台Augur

本文介绍我最近了解到的一个挺有意思的,让你觉得竟然还能有这种操作的新型市场预测平台--“Augur”。Augur是一个基于区块链技术的应用项目。当然,笔者根据市...

3114
来自专栏新智元

一分钟发现一个引力透镜,天文学家使用神经网络探索宇宙

来源:the verge 编译:Cecilia 【新智元导读】人工智能在天文学上得到许多应用:识别星系图片、分类数据、制造信息填补对宇宙的认识盲点等。此外,研究...

31411
来自专栏吉浦迅科技

人工智能技术怎样帮我戒掉布朗尼蛋糕

我那风中烛火般摇晃的意志力在跟双份巧克力布朗尼蛋糕对抗着,果不其然,布朗尼蛋糕大胜。 Lose It 饮食 app 的深度学习卡路里计算器,是我拿来对抗美食诱惑...

42114

扫码关注云+社区