数据科学家节选(2)

【节选自即将由电子工业出版社出版的《数据科学家养成手册》第二章】

科学之科

在中国古汉语体系中多为单字词,所以大家想想也能猜得出“科学”一词其实并非中国所发明。

的确,“科学”是个舶来的词汇。“科学”一词由明治维新时期日本学界初用于对译英文中的“Science”,由日本启蒙思想家西周(にしあまね,1829年~1897年)进行翻译引入的(科学——かがく),欧洲语言中该词来源于拉丁文“Scientia”,意为“知识”、“学问”,在近代侧重关于自然的学问。

科,会意字:“从禾从斗,斗者量也”,所以“科学”一词取义就是“测量的学问”这样一个含义。这里说到的“测量的学问”本身就有一种精确性的含义,尤其是能上升为学问的范畴,那就是带有比较严格的推敲的色彩,而经得住推敲的东西通常体系性比较完整,能够相互支撑自圆其说,这就是科学这个词的字面含义了。

科学是一种泛指的领域,数据科学、计算机科学、社会科学、经济科学、语言科学、生物科学等等,这些各领域的科学各自有各自的体系和规范以及认知特性。这些都是小的,窄而深的认知领域。科学,不管是某个领域的科学,还是泛指的科学认知体系,都有最基本的要求——那就是精确性和体系性,即便在突破性上的特点不明显也必须保证其精确性和体系性的存在和可靠。

边界的迷茫

人类在不断认知世界的过程中成长起来,随着科学水平的进步,观测手段的强化,工具水平的发展,人们把眼镜、耳朵、手脚都做了极大程度的“延伸”。

人的肉眼在晴好的天气情况下可以在海平面上看到距离20到30千米的船只(视船只大小),在高山顶上可以看到超过距离300千米的城市建筑轮廓。在使用望远镜的情况下,远处的物体通常可以放大8倍到10倍,这样看20千米外的物体就像观察距离2千米的物体一样。图为在贵州省兴建的500米口径球面射电望远镜(FAST)。

而在使用这种大型射电望远镜可以观测超过130亿光年以外的星体。不过也有人说这种观测方式的被动性比较强,与其说是“看”不如说是“听”。这种观测距离上的提升是极大的,从20千米的距离提升到130亿光年,大约提升6.15×1013倍。

在人类不断扩展自己视界的边界中,不断认识到有新的星体,新的星系存在,也不断发掘到有新的天文现象,并逐步推翻旧有的天文学知识概念,建立新的天文学知识概念。在任何一个历史时期,人类既无法说清现在所掌握的知识有哪些局限性,也无法预测未来会有什么新的发现可以补充现有的知识,这就是人类认知边界扩展中一直困扰着人类的事情。

不仅是望远技术的提升带给我们不断的新的发现与知识颠覆,对不同电磁波长的感知也让人类在认知体系上有了质的飞跃。

人们最初只能凭借肉眼看到可见光部分的电磁波,也就是波长在380nm到780nm范围内的电磁波,其它波长的电磁波人类仅凭借肉眼是看不到的。波长从大到小粗略分就是我们平时说的“红橙黄绿青蓝紫”这七色光。波长比红色可见光还要大的称为红外线,红外线是在1800年由英国天文学家、古典作曲家、音乐家弗里德里希·威廉·赫歇尔(Friedrich Wilhelm Herschel,1738年11月~1822年8月)通过棱镜分光发现的。

其后,由于物体的红外辐射现象,人类又发明出了很多应用性很强的工业品,比如夜视仪。

而红外线的在医学上也有非常好的临床效果,在红外线区域中,对人体最有益的波段就是4微米到14微米(4000nm到14000nm)这个波段范围,这个在医术界里面统称为“生育光线”,因为这个红外线波段对生命的生长有这促进的作用,这个红外线对活化细胞组织,血液循环有很好的作用,能够提高人的免疫力,加强人体的新陈代谢。家用医疗中也有很多形形色色的红外治疗仪,大多都是利用这种性质。

波长比紫色可见光还要小的电磁波叫做紫外线。紫外线指的是电磁波谱中波长从 10nm到400nm 辐射的总称。1801 年德国物理学家、化学家里特(Johann Wilhelm Ritter,1776年~1810年)发现在日光光谱的紫端外侧一段能够使含有溴化银的照相底片感光,从而发现了紫外线的存在。

随着观测技术水平的发展,波长更大的微波、无线电波、长波;以及波长更小的X射线和伽马射线也逐渐被发现。

从人类在可见光的认知范围内不断徘徊,到近代二十世纪三十年代后发现超长波(波长1m到10的7次方m)存在的这个漫长的探索过程中,没有人能预测下一步或者什么时间在什么情况下我们能发现新的波长形式的电磁波的存在。即便我们可以去猜测可能会有某种波长的电磁波存在的情况下我,我们通常不能预言观测的具体条件、时间和地点。这种对科学未来的无法预知性不仅仅是在光学这一个小小的领域,在物理学的其他领域,以及化学,地理学,天文学,数学等这些领域我们同样有着边界扩展中的迷茫,甚至很多时候让我们方向难辨。

美国前国防部长唐纳德·亨利·拉姆斯菲尔德 (Donald Henry Rumsfeld,1932年7月~)在他出版的回忆录《已知与未知》中写过这么一段堪称绕口令的话:“据我们所知,有‘已知的已知’,有些事,我们知道我们知道;我们也知道,有 ‘已知的未知’,也就是说,有些事,我们现在知道我们不知道。但是,同样存在‘未知的未知’——有些事,我们不知道我们不知道。”

这段话应该说,本意不是来说明认知科学中的迷茫的,但是放在这里却有了异曲同工的效果——确实,我们在对客观世界认知的过程中会时常伴随这种“已知的已知”,“已知的未知”,“未知的已知”和“未知的未知”。这让我们头痛不已,但是同时也让我们对不断开拓认知边界中产生的乐趣充满了无穷的期待。

原文发布于微信公众号 - 奇点(qddata)

原文发表时间:2016-12-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【数据分析】EMC杯开放数据比赛 – 金刚队作品

今天为大家带来的优秀作品赏析,是来自交大的“葫芦娃大战变形金刚”队的“小康的吃路历程”。金刚队成员:康世勇、沈家齐、黄鈃灵、焦天翼、吴嘉韵。 饮食特征: 横坐...

3298
来自专栏钱塘大数据

细思极恐!大数据和机器学习揭示十二星座的真实面目

作者:经管之家 “为什么我的论文总发表不了,是不是我天生就不是做研究的料?”很多同学在写论文中遇到挫折,经常会发出这样的疑问。那么今天我就用星座,真实的数据和“...

36712
来自专栏钱塘大数据

史上最烧脑物理学科普,看完瞬间涨姿势!

这是一部壮丽的物理史诗,这是一串光耀后世的姓名。他们是:牛顿,高斯,黎曼,麦克斯韦尔,爱因斯坦,杨振宁,拉马努金,霍金,维藤……(且慢,最近十年,我们只能在娱乐...

2462
来自专栏iOSDevLog

AI简史

“人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技...

1203
来自专栏顶级程序员

当今世界最NB的25位大数据科学家

引言   在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产...

3028
来自专栏大数据文摘

大数据的陷阱

1737
来自专栏华章科技

细思极恐!大数据和机器学习揭示十二星座的真实面目

原文链接:http://bbs.pinggu.org/thread-5905227-1-1.html

841
来自专栏DT数据侠

这个2017最佳数据可视化案例,竟是个音乐剧freestyle

《汉密尔顿》这部红极一时、创造票房奇迹的音乐剧,不仅让奥巴马全家观看了两次,也影响了整个美国百老汇。今年‍‍的“GEN数据新闻奖”中的年度数据可视化奖,就被来自...

1390
来自专栏达观数据

不止你们可以吐槽高考作文,机器也可以!

在吐槽满屏的高考季,高考作文成最大槽点。如果我们放下人类的架子,从AI算法的角度来观察,会不会看到什么新奇的结果?小编向达观AI机器君投喂了近几年的高考命题和满...

3666
来自专栏CDA数据分析师

想太多,何不扎实的学?【统计学经典教材书单】

一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益...

29610

扫码关注云+社区

领取腾讯云代金券