数据科学家节选(1)

【节选自即将由电子工业出版社出版的《数据科学家养成手册》第一章】

  1. 什么是科学家

从我们每个人上学前班的时候,我们就开始受到各种各样的启蒙教育,哪怕是捏橡皮泥、跳皮筋、玩弹球这些最最普通最最不起眼的游艺项目,都是我们在锻炼协调性和认识世界的过程。认识世界是我们每个人终其一生一直在进行的过程,不仅如此,我们几千年来世世代代也都在不断重复这个过程,日复一日年复一年,从未停止。

不管是中国历史还是世界历史,在从古至今的各个时期或者朝代,都留下过很多故事。除了王侯将相们会留下他们的传记以外,还有两类人也会留下他们的名字,而且这些名字会被大家自发记住并且广为传颂,一类是艺术家——人类的生命因他们的提炼而升华,人类的生活因他们的演艺而更加精彩;还有一类就是科学家——是他们为人类的进步,一砖一木一石一瓦地搭建一级级坚实的台阶,他们是一群伟大的人。我们要说的就是这样一群伟大的人。

在我们印象中的科学家通常都是天资聪颖,智慧出众,在某一领域理解深刻的。科学家与我们常人都有哪些区别呢?是因为他们更聪明所以才能当科学家吗?是他们记忆力殊绝于人才能当科学家吗?是因为他们有更好的坚忍不拔的性格才能克服困难成为科学家吗?我认为这些因素都只是成就科学家的一部分因素,而且既不是充分条件也不是必要条件。

作为一个有知识和有一定文化程度的常人来说,其实很多技术很多科学原理我们都能理解而且加以应用,而且不乏有些人会应用得非常纯熟,但是众多的常人中却很少有能够被称为科学家的。原因何在呢?

1.1 从东升西落开始

1.1.1 农历

太阳东升西落,一年四季夏热冬冷,这种信息叫常识,即便没有任何人来总结这些规律告诉我们,在一个人的生命周期里每天每月每年都在体验着这种交替,我们常人都可以得到这样的结论。这不足为奇,当然更不可能让每个人都因为对这种常识的总结或感知而成为科学家。

人们现代使用的历法——公历、农历,是有着完整的时间标识,日期标识,四季节气标识,并可以进行换算,时间加减,误差补偿的完整的历法体系,非常准确与精妙。中国人古代习惯使用的农历也叫阴历(这种叫法其实并不严谨,应该叫阴阳历)、夏历,是从夏朝甚至更早以前就被人总结出来一直使用至今的。中间历朝历代都在为这个历法体系的健全进行修订,我们现在所用的农历历法体系大部分都是来自于在西汉太初年间进行修订的版本也就是太初历,所以叫做汉历更合适。

年月日换算的规则大致规则是这样,太阳东升西落算一日,月亮完整的一次盈亏周期29.53059天算一个月(朔望月)。地球公转和黄赤交角变化产生的春夏秋冬轮回的一年平均长度为365.2422日。它们之间大约是12倍的关系,不过这样算一下12个朔望月和一个回归年的差距有10.87512天——这个差距可不算小。

如果直接以12个朔望月作为一年的话,这样的结果在多年叠加后会让人感觉很滑稽,因为如果假设一年农历的正月初一和公历的1月1日在同一天,第二年公历1月1日的时候,农历已经是1月11日了;第十年公历1月1日的时候,农历已经是4月18日了,再往后就越差得多。历法在很大程度上是为了对时间周期进行描述并指导农耕等生产行为的,这种误差会让每个月对应的天气情况和由于地球公转的太阳年产生的真实情况有着非常大的差别,如果要进行几月播种几月收割这种知识的传授,几乎都要加一个“时间漂移”条件才能使用。并且每隔33.5851年用朔望月12个月为定年标准的历法就要比太阳年整整差出一年去,无论如何这种历法体系到这里设计都显得非常不健全。还好先人们想出了“闰月”这个办法来进行误差补偿。

29.5306*i+29.5306*12*y=365.2422*y

根据刚刚我们得到的条件,我们现在要求i和y的取值,意义就是说在y个太阳年中加入i个闰月是能够把误差补齐的。这样算出来,我们可以得到一组相对精确的数值:

y=19, i=7

带进去算一下,会得到误差为0.0892天,即在19个农历年中加入7个闰月这样基本能够调平12个朔望月所形成的一年和一个太阳年之间的大部分差值,还剩下一个0.0892天的误差,约合2.1408小时。刚刚说的这种方法就是农历中提到的“十九年七闰月法”。

在二十四节气中的冬至是一个非常重要的节气。冬至是用圭表进行观测标出的,这一天太阳直射南回归线。现在置闰的方法是两个冬至之间,如仅有12个朔望月则不置闰,若有13个朔望月即置闰。置闰的月从冬至开始,当出现第一个没有中气的月份,这个月就是闰月,其名称是在前个月的前面加一个“闰”字,例如八月后需要置润,那么八月后的这个月不叫九月而叫做闰八月,闰八月之后才是九月。

有趣的是,农历中的正月、二月、三月……冬月、腊月,这些月是按照朔望月来进行计算和标注的。但是,二十四节气却是根据对太阳运行的周期规律的观测来进行标注和计算的,进而对农历做了补充历法,要不怎么说农历是阴阳历呢。所以每一年的农历月和节气之间就会像和公历之间那样产生“错位”,因而产生农历月中会有“不太规律”的缺中气的月出现。不管是哪个月,反正是从冬至开始计算,第一个没有中气的月就做一次闰月。二十四节气最早被全数记录是在《淮南子·天文训》中,当然其中也包括关于“十九闰七”的天文现象论述。

二十四节气在中国民间已经扎根了几千年,我们依赖它进行农耕,甚至依赖它进行基于中医药理论的人体调理,依照节气进行相应的补泻,据说效果尤佳。这对于“民以食为天”的中国人来说格外地亲切,也不乏中国的民间艺术家们用充满灵性的画笔对这种古朴的文化热情地演绎。

大家来看,从一个“太阳东升西落,一年四季夏热冬冷”做出发点就能归纳出这么大一套完整的由太阳、地球、月球天体运行所产生现象的周期性规律总结,并能将它用于指导农业生产,不能不说是一项非常重要并且有深远意义的科学体系。当然和“太阳东升西落,一年四季夏热冬冷”的知识相比,完整的农历就是科学的——虽然我们已经不知道最开始发现他的科学家是谁了,我猜想这也不会是一个人的成就,而是千百年来一代一代热爱智慧的人们通过不断观察、总结、实践、补充而逐渐形成的越来越完整的理论体系,这是一个平凡而伟大的工程。

原文发布于微信公众号 - 奇点(qddata)

原文发表时间:2016-12-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

一个八卦的AI,嗅到了你和TA之间基情满满

952
来自专栏腾讯高校合作

【CCF-CV特别活动】“CCF-腾讯犀牛鸟沙龙”走进腾讯优图

中国计算机学会计算机视觉专委会走进企业系列交流会 CCF-CV@Industry 腾讯优图·上海 主题:图像识别和多媒体分析技术前沿 时间:2016年5月13日...

5675
来自专栏华章科技

豆瓣还是朋友圈:大数据、新方法和日常问

问题来了,怎么才能设计一种实证策略,把这两种效应区分开呢?这是Gilchrist和Sands在Journal of Political Economy即将刊出的...

863
来自专栏AI2ML人工智能to机器学习

易图秒懂の机器学习诞生 奠基篇

在“易图秒懂の人工智能诞生”、 “易图秒懂の符号主义诞生” 和 “易图秒懂の连接主义诞生”,我们看到人工智能的发展经历了符号主义和连接主义的壮大的洗礼。 其实它...

1001
来自专栏大数据文摘

视觉研究的前世今生(下)

2944
来自专栏大数据文摘

[译]贝叶斯生存分析之“权利的游戏”

2916
来自专栏专知

走近Hinton:AI教父传奇人生

【导读】Geoffrey Hinton花费了30年的时间默默无闻,直到2012年,他证明了其研究的价值,并驳回了大多数其他科学家所谓的正确观点。如今,这个被称为...

3996
来自专栏AI科技评论

视频 | 传说中的照妖镜,AI 竟然变成面瘫演技的救星与考验

AI 科技评论按:这里是雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

873
来自专栏量子位

别打了别打了,天上无人机看着呢 | AI分析暴力姿势

天空之眼 (Sky In the Eye) ,不只是斯内普教授的遗作,也是一组研究人员为自己的新论文,选定的题目。

1012
来自专栏数据科学与人工智能

【数据科学家】当今世界最牛的25位顶尖大数据科学家

引言 在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影...

4995

扫码关注云+社区

领取腾讯云代金券