首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

三大定律到大数据分析

在这些珍贵数据基础上完成了出色工作,是他研究助手。 三、如何找出规律?...不过,三大定律例子,可以用一句简单直白的话来理解大数据: 分析和挖掘数据数据找出规律,这些规律为我们所用,从而产生价值。...数据分析:基于第谷数据,利用数学等方法对数据进行分析,找出了数据规律(例如第三定律就是一条公式 )。 数据应用(价值):三大定律对推动整个天文学发展起到了关键作用。...布拉格大街第谷和雕像 在一个大数据团队,往往有不同角色,例如研发工程师、数据分析师、业务专家等。...而将分析尺度拉长到年,很快便发现了隐藏在数据规律。”

1.3K40

如何 100 亿 URL 找出相同 URL

5, 000, 000, 000 * 64B ≈ 5GB * 64 = 320GB 由于内存大小只有 4G,因此,我们不可能一次性把所有 URL 加载到内存处理。...使用同样方法遍历文件 b,把文件 b URL 分别存储到文件 b0, b1, b2, ..., b999 。...这样处理过后,所有可能相同 URL 都在对应小文件,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...那么接下来,我们只需要求出这 1000 对小文件相同 URL 就好了。 接着遍历 ai( i∈[0,999] ),把 URL 存储到一个 HashSet 集合。...然后遍历 bi 每个 URL,看在 HashSet 集合是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件

2.8K30
您找到你想要的搜索结果了吗?
是的
没有找到

望远镜正式退役,其庞大数据库仍将推动地球上发现

服役9年望远镜共计观测到了50万颗恒星。 策划&撰写:温暖 据外媒报道,日前,美国NASA太空望远镜将正式“退役”,未来在燃料耗尽之后,它将会在安全轨道上漂移。...但由于服役时间过长,此前,望远镜已经丢失了四个反应轮一个,而这些反应轮就是用来帮助它在太阳和其他力量作用下重新定位望远镜方向。不过,好在它设计支持它在反应轮不全情况下继续工作。...由于没有反应轮来改变它所在三个轴上方向,望远镜就不得不再每次需要改变视角或者旋转以此将数据传回地球时候,燃烧它身上宝贵燃料。...而即便没有燃料,望远镜仍然在大量收集数据,科学家们表示,在这段期间内,它又发现了1200多颗系外行星。...如今,望远镜任务就要结束了,而它也将用最后存储燃料机动到预期位置,通过深空网络作为中继发送了最后一批数据。这些数据将如同以往提供给科学家、研究组织以及NASA自己团队。

51820

面试:如何 100 亿 URL 找出相同 URL

5, 000, 000, 000 * 64B ≈ 5GB * 64 = 320GB 由于内存大小只有 4G,因此,我们不可能一次性把所有 URL 加载到内存处理。...使用同样方法遍历文件 b,把文件 b URL 分别存储到文件 b0, b1, b2, ..., b999 。...这样处理过后,所有可能相同 URL 都在对应小文件,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...那么接下来,我们只需要求出这 1000 对小文件相同 URL 就好了。 接着遍历 ai( i∈[0,999] ),把 URL 存储到一个 HashSet 集合。...然后遍历 bi 每个 URL,看在 HashSet 集合是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件

4.4K10

面试:如何 100 亿 URL 找出相同 URL

“5, 000, 000, 000 * 64B ≈ 5GB * 64 = 320GB 由于内存大小只有 4G,因此,我们不可能一次性把所有 URL 加载到内存处理。...使用同样方法遍历文件 b,把文件 b URL 分别存储到文件 b0, b1, b2, ..., b999 。...这样处理过后,所有可能相同 URL 都在对应小文件,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...那么接下来,我们只需要求出这 1000 对小文件相同 URL 就好了。 接着遍历 ai( i∈[0,999] ),把 URL 存储到一个 HashSet 集合。...然后遍历 bi 每个 URL,看在 HashSet 集合是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件

2.2K20

面试经历:如何 100 亿 URL 找出相同 URL

5, 000, 000, 000 * 64B ≈ 5GB * 64 = 320GB 由于内存大小只有 4G,因此,我们不可能一次性把所有 URL 加载到内存处理。...使用同样方法遍历文件 b,把文件 b URL 分别存储到文件 b0, b1, b2, ..., b999 。...这样处理过后,所有可能相同 URL 都在对应小文件,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...那么接下来,我们只需要求出这 1000 对小文件相同 URL 就好了。 接着遍历 ai( i∈[0,999] ),把 URL 存储到一个 HashSet 集合。...然后遍历 bi 每个 URL,看在 HashSet 集合是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件

1.9K00

人类借助AI技术发现了“迷你太阳系”

在这一案例,计算机学会了如何对开望远镜获得海量数据搜寻疑似的系外行星信号。...美国宇航局天体物理学部门主管保罗·赫兹(Paul Hertz)表示:“正如我们所料,在我们之前已经分析过望远镜数据仍然隐藏着令人兴奋新发现,等待着采用合适新工具或者新技术去揭示它。”...美国宇航局望远镜会记录系外行星恒星前方经过导致恒星亮度轻微下降现象,这种亮度下降信号可以让科学家们间接推算出行星存在以及这颗行星很多物理性质。...在这次发现,研究人员克里斯托佛·沙律(Christopher Shallue)和安德鲁·范德伯格(Andrew Vanderburg)训练一台计算机学习如何去对开望远镜获得海量恒星亮度数据进行分析...除了90i,谷歌技术还发现了另外一颗恒星——-80星系最小行星“-80g”,同地球大小相仿。

65250

人工智能帮助NASA发现新行星

在这次发现,计算机通过在数据实例中发现望远镜记录太阳系以外行星(系外行星)所产生星光变化,学会识别行星。...“正如我们所预料,在我们已经存档太空望远镜数据仍然隐藏着令人兴奋新发现,等待着我们利用合适工具或技术去发掘它们。”...美国国家航空航天局天体物理学部门负责人表示,“这一发现表明,我们数据在未来几年内都将是创新性研究人员珍贵宝库。” 太空望远镜会记录系外行星恒星前方经过或跨日导致恒星亮度轻微下降现象。...在这次发现,研究人员训练计算机学习如何太空望远镜获得恒星亮度数据识别系外行星。...两位研究人员都认为,可能还有更有趣系外行星信号隐藏在这些数据。 首先,他们训练神经网络通过先前系外行星目录筛选出1.5万个信号来识别出凌日系外行星。

749130

AI帮助我们在太空“找朋友”

在随后观测,科学家发现了更多与太阳系相似的特征:-90拥有7颗行星,较小行星距恒星更近,较大行星占据外侧轨道。...对于望远镜为何一直盯着天鹅座,毛新愿解释称,望远镜是做类似“抽样调查”方式研究宇宙类地行星,选择天鹅座是因为距离合适,且人类对它了解较多。...人工智能——零学习辨别系外行星 受人脑中神经元之间连接方式启发,谷歌人工智能工程师们开始利用人工神经网络技术对开数据进行筛查,发现了此前被忽视围绕开-90旋转第8颗行星微弱凌日信号。...据毛新愿介绍,研发团队找科学家们要了15000组观测到、并被科学家们花了数年后确认已经是完全正确信号,于是这套智能系统开始分析它们,零学习如何辨别系外行星。...此外,人工智能还发现了另外一颗恒星-80星系最小行星“-80g”。

56770

人工智能大显神威:NASA找到了“第二个太阳系”

NASA天体物理学部门主管保罗·赫兹表示:“正如我们所料,在之前已经分析过望远镜数据,仍潜伏着令人兴奋新发现,等待着合适新工具或新技术来揭示它。...在长达4年运行期间,望远镜收集数据包含3.5万个疑似行星信号,尽管科学家采用人工方法筛查出了其中最可能信号,但最微弱信号往往会成为“漏网之鱼”。...沙律和范德伯格猜想,这些数据可能潜伏着更有趣系外行星发现。 于是,沙律和范德伯格训练人工智能如何根据望远镜获得亮度数据发现系外行星。...系外行星恒星前方经过时会导致恒星亮度轻微下降,望远镜记录下这种亮度下降信号,科学家可以据此间接推算出行星存在以及这颗行星诸多物理特性——这就是所谓凌日法。...不过,望远镜注定是要书写传奇,它“身残志坚”,在浩渺宇宙史上留下了自己印记。2014年开始,望远镜进入K2——“任务2”阶段。

63050

AI立功!NASA宣布发现第二个太阳系

利用美国宇航局望远镜获得数据,天文学家在近期发现了这个系统隐藏第八个行星,从而让这一系统中行星体数量达到了与太阳系相同水平。...在这一案例,计算机学会了如何对开望远镜获得海量数据搜寻疑似的系外行星信号。...美国宇航局望远镜会记录系外行星恒星前方经过导致恒星亮度轻微下降现象,这种亮度下降信号可以让科学家们间接推算出行星存在以及这颗行星很多物理性质。...在这次发现,研究人员克里斯托佛·沙律(Christopher Shallue)和安德鲁·范德伯格(Andrew Vanderburg)训练一台计算机学习如何去对开望远镜获得海量恒星亮度数据进行分析...他说:“当数据太多,人工分析难以招架时 ,机器学习技术用武之地就来了。” 望远镜在长达4年运行期间收集数据包含有3.5万个可能行星信号。

71190

发力电商小程序!京东强势入局,第三方模版市场再添重磅玩家

相比较而言,背靠着据有商品供应链、金融、大数据、物流等优势京东平台,在动作上显得有些不疾不徐,似乎并不急于投射出阳光万丈。...第一定律:京东全面开放,「积木式」赋能 在给知晓程序(微信号 zxcx0101)回复,陆寅宏提到,会基于京东强大电商基础能力,通过三种方式实现小程序场景赋能。...相比其他第三方服务商,基于京东沉淀技术及数据,极大降低了客户接入成本,同时通过积木化输出了丰富营销系统、运营工具、物流供应链、金融等能力。 ?...京东凭借平台,通过整合+组合京东和生态伙伴积木能力,本身能力和资源,可以更好地被利用,同时,还能增强京东对于商家吸引力,顺势就能积累更多用户量及其衍生购物数据,进一步让京东更好地深耕品牌电商领域...目前,利用平台搭建起了小程序商城品牌,不乏海澜之家、宝洁、SK-II 等著名品牌。可以说,京东这一策略在前期是成功

52020

还记得谷歌之前发现两颗行星吗?今天谷歌对此披露了重要技术细节

代码地址:https://github.com/tensorflow/models/tree/master/research/astronet 行星搜寻引物 首先,让我们考虑一下望远镜收集数据如何被用来探测行星存在...为了在数据寻找行星,科学家们使用自动化软件(如数据处理管道)来探测可能由行星引起信号,然后手动跟踪,以确定每个信号是否是行星。...然而,有一个诱人动机:可能存在一些潜在宜居行星,如地球,相对较小,围绕着相对较暗恒星运行,可能隐藏在传统探测阈值之下——也许还有隐藏在数据未被发现“宝石”!...考虑到望远镜收集到大量数据,我们想知道如果我们用机器学习来分析一些之前未被探索过数据,我们会发现什么。...尽管这个过程需要一段时间望远镜中下载和处理数据,但是一旦完成的话,它相对会加快训练模型速度,使其预测新信号。

59740

天文学家在AI帮助下发现“第二个太阳系”

艺术家笔下,90行星系统8颗行星(行星大小按比例描绘;距离不按照比例) 新发现90i同样是一颗类地行星,它比地球大了约30%,是该行星系统距恒星第三近行星。...太空望远镜 相比于主动发光恒星,黯淡、渺小系外行星往往难以直接观测。但当行星其宿主恒星前方穿过时,会遮住恒星一部分光线。...尽管项目已经取得丰硕成果,但很多人相信,在数据,还有很多重要信息有待挖掘。而限制我们进一步分析这些数据因素,是软件分析速度及分辨率。...用人工智能搜寻系外行星 当谷歌AI团队高级软件工程师Christopher Shallue发现,人类太空获取数据技术在不断发展,但海量数据已经将天文学淹没时,他提出一个设想:或许,我们可以将神经网络应用于数据分析...“这个过程就像石头中找寻宝石,如果你用一个更细滤网,那么你在得到更多石头同时,也会找到更多宝石。” 90i并不是这个神经网络筛选出来唯一宝石。

45380

天文界又一重大突破!谷歌和NASA利用AI找到了两颗新行星

现在人工智能正在帮助寻找更多东西。 ? 90(Kepler-90)星系行星与我们太阳系行星大小对比。...谷歌人工智能研究人员Christopher Shallue说,他认为这是第一次神经网络成功地数据中发现了一颗新行星。...为了找到这些行星,研究人员在NASA提供数据,对15000个标记信号进行了训练,以识别行星。在测试,该算法能够在96%正确时间里识别出哪些信号反映了行星,而哪些不是。...在历时4年首次任务观察了20万颗恒星,在此过程创造了约140亿个数据点。Shallue说,有了这么多数据,他们算法就会发现更多行星。...想要搜索行星的人可以NASA网站上下载完整数据集,而寻找行星搜索算法源代码也可以免费获得。

689110

DIY发现新行星操作指南 | 谷歌开源了行星发现代码

所以亮度变化数据图上,我们可以看到一个“U形”凹陷。 不过,恒星亮度降低也还有其他可能。比如说双恒星,恒星斑,光度计被宇宙射线干扰了或仪器本身噪声。...本来,数据库里找行星办法是这样↓ 天文学家们用软件,自动批量处理数据,寻找光度曲线U形信号。...回头泥萌可以参考这个找新。 第一步,是按照代码主页上说明来训练模型。 望远镜下载和处理数据会花一段时间,这之后模型训练、新数据预测速度会相对较快。...△ 这个图就是90 i光度曲线。 当时BLS算法就检测到了 这个持续时间长达2.7小时U形信号, 每14.4天出现一次。 该数据取自2009年 开始记录信号。...经过后续天文学家分析,确认了这个信号是一个真正系外行星,就是后面我们大家都知道90 i了。 这次捡漏到了两颗新行星,还是670颗恒星数据里刨出来

80050

美国宇航局借助AI发现系外行星、可搜索图片文字AI

美国宇航局官网消息,这颗行星距离地球约2545光年,被命名为90i。这是一颗炙热岩石星球,其地表平均温度超过华氏800度,每14.4天绕其星系恒星——90(又称KOI-351)一圈。...它是90星系第八颗行星,意味着这一星系已知行星数量与太阳系相同。...据《财富》杂志报道,90i是由谷歌公司人工智能通过数据运算,分析太空望远镜收集信息后,识别出这颗行星。...美国宇航局天体物理学部门主任保罗·赫兹(PaulHertz)表示:“太空望远镜数据藏着许多科学家容易忽略数据信息。它们等待着新科技和工具发掘。...行星90i发现证实了借助人工智能将成为研究数据一种全新方式。”

661100

【业界】程序员也是天文学家?利用机器学习寻找行星

观测了大约20万颗恒星,历时4年,每30分钟拍摄一次,创造了大约140亿个数据点。这140亿个数据点转化为大约2千万亿可能行星轨道!...90i是已发现第8个围绕开90恒星运行行星,它成为我们已知第一个8星系统。 用我们工作模型,我们拍摄了恒星,用它来寻找开数据新行星。...为了缩小搜索范围,我们研究了已知670颗恒星,其中包括已知两个或更多系外行星。在此过程,我们发现了两个新行星:80g和90i。...我们使用了15,000个标记信号来训练我们机器学习模型来识别行星信号。我们用这个模型在670颗恒星数据寻找新行星,并且发现了之前搜索漏掉两个行星。...到目前为止,我们用模型搜索了20万颗恒星670颗。在数据可能还有许多未发现系外行星,新想法和机器学习等技术将有助于在未来许多年里推动天体发现。

52650

程序员也是天文学家?利用机器学习寻找行星

但是在机器学习帮助下,我们最近取得了一些进展。 天体物理学家寻找太阳系外行星主要方法之一是通过同时使用自动软件和人工分析NASA任务大量数据。...观测了大约20万颗恒星,历时4年,每30分钟拍摄一次,创造了大约140亿个数据点。这140亿个数据点转化为大约2千万亿可能行星轨道!...90i是已发现第8个围绕开90恒星运行行星,它成为我们已知第一个8星系统。 用我们工作模型,我们拍摄了恒星,用它来寻找开数据新行星。...为了缩小搜索范围,我们研究了已知670颗恒星,其中包括已知两个或更多系外行星。在此过程,我们发现了两个新行星:80g和90i。...在数据可能还有许多未发现系外行星,新想法和机器学习等技术将有助于在未来许多年里推动天体发现。

517100

Java加载机制谈起:聊聊Java如何实现热部署(热加载

在被加载到JVM时,对象是由内存结构来表示,结构占据了某个特定大小(它域加上元数据连续内存区域。...理论上来说,由于字节码翻译通常是用来修改类字节码,因此若仅仅是为了根据需要创建足够多类来履行类功能的话,我们没有什么理由不能使用类信息。...Java EE标准制定并未怎么关注开发周转期(Turnaround)(指的是对代码做修改到观察到改变在应用造成影响这一过程所花费时间)。...JRebel与应用服务器整合在一起,当某个类或是资源被更新时,其被工作区而不是归档文件读入。...除了类重载之外——还有配置和元数据 在消除周转期这一过程,另一个问题变得明显起来:现如今应用已不仅仅是类和资源,它们还通过大量配置和元数据绑定在一起。

2.9K20
领券