TensorFlow从0到1丨第3篇:人类学习的启示

上一篇TensorFlow的内核基础介绍了TF Core中的基本构造块,在介绍其强大的API之前,我们需要先明了TF所要解决的核心问题:机器学习。

什么是机器学习?

图1.美索不达米亚文明

公元前4000年,在现今的伊拉克境内,有过世界最早的文明中心之一美索不达米亚(Mesopotamia)。那里的苏美尔人根据观察,发现月亮每隔28、29天就完成从新月到满月再回到新月的周期,而且每过12、13个这样的周期,太阳就回到了原来的位置,据此发明了太阴历。从此,他们具有了预测日食和月食的能力,具有了安排农时的能力。

托勒密的地心说

图2.地心说

公元2世纪,托勒密提出了“地心说”。托勒密基于过去上百年来的天文观察数据,用最基本的、无法再简化的原型(圆形)对行星运行轨道进行了建模,该模型在一定情况下是准确的,并可以用于预测。

现代人回头看或许对此相当不以为然,可在当时的天文学界这算的上是最伟大的文明成就,直到14个世纪后才被哥白尼的“日心说”推翻。吴军在其《智能时代》一书中,如此形容其发明者克罗狄斯·托勒密:

“在我看来,托勒密在近代之前是当之无愧的最伟大的天文学家,没有之一”。

之所以托勒密有如此高的地位,并不完全是因为地心说,而是他的思维方式和方法论(影响了西方世界一千多年),简单概括就是:“通过观察获得数学模型的雏形,然后利用数据来细化模型”。直到今天这种朴素的方法论依然管用。

人类的学习

图3.人类的学习

前面两个例子揭示了人类学习的一般规律,而文明的形成过程就是上面这个过程的无数次的迭代。现在人类的知识库中积累了大量反应真实世界的模型,比如牛顿三大定律、万有引力、质能方程等,基于这些模型,就可以安排火箭发射,登月,建立粒子加速器。

机器学习

在过去,积累观测数据,动辄就是上百年,假设、调整并验证一个模型又是一个漫长的过程。而当今我们面临的是数据爆炸,全世界90%的数据,都是在最近几年产生的。如果能让机器根据大数据动态的发现、调整模型,直到得到一个稳定的、能代表真实世界规律的模型,那么人类就可以大大缩短找到规律的时间,并利用该模型改善自身环境。这就是基于大数据进行机器学习的思想。

休谟的问题

机器学习的挑战之一,就是数据的完备性。也就是说数据的收集只有量大还不够,如果不完备,就会得到错误的模型。经常听到的黑天鹅、罗素的归纳主义者火鸡、过拟合都是指向这个问题。

其实不仅机器学习会有这个问题,人也一样。《终极算法》一书中,有一个真实例子:

一个白人小女孩,在商场看到拉美裔婴儿时脱口而出:“看,妈妈,那是小女佣”。小女孩并非生下来就是偏执狂。那是因为在她短暂的人生阅历里,她对见过的仅仅几个拉美裔女佣进行了笼统的概况。

早在18世纪,最伟大的经验主义哲学家休谟就提出了这个经典问题:

在概括我们见过的东西以及没见过的东西时,怎样才能做到合理?

从某种意义上说,每种学习算法都在尝试回答这个问题。

原文发布于微信公众号 - 人工智能LeadAI(atleadai)

原文发表时间:2017-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

邓侃解读谷歌首篇电子病历论文:完整披露谷歌医疗大脑野心

作者:邓侃 【新智元导读】上周,谷歌公布了首篇电子病历相关论文,由Jeff Dean率队联合众多大牛和顶级医学院完成。然而,不少业内人士,包括康奈尔大学副教授王...

3307
来自专栏专知

机器学习是“炼金术”?

1446
来自专栏AI科技评论

【深度】Nature:我们能打开人工智能的“黑箱”吗?

编者按:人工智能无处不在。但是在科学家信任人工智能之前,他们首先应该了解这些人工智能机器是如何运作的,这也就是文中所提到的“黑箱”问题。在控制论中,通常把所不知...

3006
来自专栏新智元

【强化学习炼金术】李飞飞高徒带你一文读懂RL来龙去脉

来源: 心有麟熙 作者: Jim 范麟熙 编辑:常佩琦 【新智元导读】斯坦福大学博士生、师从李飞飞教授的Jim Fan(范麟熙)带你一文读懂强化学习的来龙去脉。...

4019
来自专栏大数据文摘

VR如何巧妙填补传统数据视觉化的漏洞

1684
来自专栏人工智能头条

【无人驾驶技术系列】光学雷达(LiDAR)在无人驾驶技术中的应用

2085
来自专栏大数据文摘

机器也有品味:谷歌最新算法让街景图具有专业摄影师审美

1272
来自专栏新智元

MIT非视线成像“透视相机”:隔墙观物、影中窥人!

2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射...

1195
来自专栏鹅厂优文

游戏人工智能 读书笔记(十一)游戏内容生成

说到最早使用算法来生成地图的游戏,或许就是1973年的Maze War[1]这款游戏了。在游戏中,玩家以第一人称视角操控,在一个迷宫里面游荡,时而会遇到敌人进行...

1654
来自专栏机器之心

资源 | CNN入门材料:《解析卷积神经网络——深度学习实践手册》

38910

扫码关注云+社区