用机器学习的经验指导人生:如何实现学习效率最大化

大数据文摘作品,转载要求见文末

原作者 | Raimundo Manterola

编译团队 | Aileen,黄文畅,范玥灿

如果要是我告诉你我们可以依照“训练”电脑的经验来指导人类学习新的技能,你觉得怎么样?

在这篇文章中我不会太深入的分析机器学习是如何工作的。但是,在介绍如何把AI应用于你自身的学习之前,我希望你能了解一些基本的概念。

我们都喜欢狗狗的照片,它们让我们想起那些与这些这些四条腿的小伙伴们一起玩耍度过的清晨。

我们可以很容易的在照片中认出狗狗,因为我们已经看过千百次它们长什么样子。

可是如果一个外星人因为好奇狗狗长什么样而绑架你,你会怎么办?他强迫你教他如何识别狗狗,这样他就可以绑架一只带回他的星球。

请记住,他完全不知道狗狗长什么样。你要怎么做?

你可能需要告诉交给他一些“规则”:狗狗有四条腿,两只眼睛,两只耳朵…可是,这可能没有想象的那么容易,因为有很多很多的规则。试想一下,你要怎么教会他区别狗狗和狼?这真的很难。

这个设定一些规则并照之遵守以得到想要结果的学习过程叫做 “演绎学习”。可是难点就在于很难顾全所有的可能的变化。

想象一下,除了展示给他一千张狗狗的照片,另外如果给让他看一千张照片都不是狗狗的照片。那事情就变得容易很多了!

我们人类正是这么学习的。通过千百次的观察我们知道了狗狗长什么样。当我们的大脑看到一些它可以认知的东西的时候,某些神经区域就会显示出逐渐增加的活跃性。但根据国家研究委员会出版的《人们如何学习》一书,人类在出生时并没有这些神经特征。随着年龄的增长,有了越来越多的经验,我们的大脑就开始整理如何建立这些联系。

神奇的是,机器学习正是这么工作的。当建立一个机器学习模型的时候,我们不会教他“规则”。而是提供给诶他大量的案例,有的可以得到想要的结果,有的不可以,然后就让电脑自己整理,就像我们的大脑会做的一样。

大部分人认为AI是一个使工作自动化的工具,可是让人们专注于建立像人类行为一样的算法理论。举例来说,脸书(Facebook)的面部识别算法理论比人类的识别能力还要强。可是如果我们反向而为呢?

机器学习是如何工作的?

假设没有空调也没有泳池的你实在是难以忍受这炎热的夏天,你决定在邻居不在家的时候偷偷的潜入他家用他的泳池。

你已经知道大多数时候他都不在家,因为他打网球。所以你决定应用你的AI技能来建模,根据天气挺起情况预测他是否会打网球。

经过几周对他的观察他和并收集了相关数据,你总结了如下表格:

既然你有了好的、有代表性的数据,你便可以开始建模。

有很多种不同的方法,我将用一种叫做决策树的技巧来简单讲解归类问题。

你觉得在上图表格中哪个那个变量会影响你邻居要不要打网球的决策?可能是天气情况。

要弄清如何构建决策树,我们的模型会找出哪那些变量可以将数据最好的分割开来。把天气情况放在决策树的根部,然后我们就可以开始用同样的方法来建立更多的枝杈,直到决策树看起来如下图:

训练完模型之后,我们就会得到一个可以帮助我们预测邻居是否在家的决策树。

你可能会想:“这到底会怎么帮助我学习一个新的技能?”

如果你想要训练一个好的理论可以用来使你的学习收益最大化,有一些主要的规则需要遵守。

如果你想了解更多关于机器学习的知识,这里有一些很棒的资源。

◆ 练习,练习,再练习——收集大量的数据

不是当你已经优秀了才去练习,而是不断地练习帮助你变得优秀。

——Malcolm Gladwell

这一条比较简单——练习的越多,你就会变得越好。

我们都听过“大数据”这个时下很火的词。可是只有很少的人真的了解他真正的含义。根据牛津词典的解释,大数据是:极其大的数据集,需要用计算机来分析并展现出它的特征、趋势和联系,尤其是与人类行为相关的部分。

大数据是用很多很多的例子来训练一个模型。

根据牛津关于技能学习的神经机制的研究,当我们开始学习一些新东西,这个过程中包含了很多神经活动。但当我们反复练习同一个任务的时候,每一次完成他所需要的脑力就会逐渐减少。

当你建一个机器学习的模型时,这会很大程度上决定你算法表现的好坏。你需要很多很多的案例才能得到一个好的模型。相较于给外星人看几张照片,给他看更多的案例会让他学习的更好。

但是不变的是,基于大量的数据建立简单的模型胜过只有少量数据的复杂模型。

——Alon Halevy, Peter Norvig, and Fernando Pereira, Google. The unreasonable effectiveness of data.

我们花了很多时间来学习相关的课题,比如阅读,看视频,向人们请教等,但在真正上手练习之前还是会犹豫很久。

唯一能让你有所提高的办法就是去实践。

◆ 不要死记硬背:避免过度拟合

回顾在学生时代的时候,你是否又有因为死记硬背某个数学题目的解法,却因为考试中的题目与记下来的题目稍有不同而解不出来?这其实是同样的概念,那一点点的不同就可以让你的方法一文不值。

如果你死记硬背一个流程同样会如此,我们会失去将问题普适化、解决没有见过的情形的能力。

在机器学习过程中,这个叫过度拟合。当你训练你的模型通过记忆来学习,就会发生这样的事情。这其实很危险,因为如我们如果用同样的数据集来测验,可能会有100%的拟合度,但当遇到没有见过的问题的时候会表现的很差很差。

当我们知道有办法可以点击一下鼠标就解决问题,就没有必要死记硬背了。

这就是为什么很多人学不会编程。他们会因为有太多的东西去要记忆而失去信心。可是,这正是问题本身——我知道的所有擅长编程的人都很会使用“谷歌”。

根据Eric Mazui (哈佛大学物理学教授,同时也是Peer Instruction的作者)的研究,一个互动式的学习会让学生对问题的理解力比死记硬背的学习高三倍。

这个道理很简单,强迫你自己在没有指导的情况下学习。当你自己弄明白了一些道理之后,你就可以回顾整个过程,这样可以避免没有理解就死记硬背。

◆ 给你的训练做适当的变化:准备多样、有代表性的数据

我们通常会认为不断重复做同一件事会让我们最终成为专家。即使我们从中取得进步,但还有更快捷的方法。不只是练习本身,而是练习的方式。

最关键的就是使学习有变化。

最好的吉他手不只是演奏一个类型——这也是为什么摇滚明星不可能通过只玩摇滚而成为最卓越的演奏家。要达到他们的高度,需要不断尝试并练习不同的音乐类型。所有这些不同的类型的特质,会帮助吉他手成为全能大师。

如果不知道布鲁士…就没有办法用吉他玩摇滚或是其他大众音乐。

——Keith Richards

要想在某一领域有所建树,你不可以只是重复做同一件事。你必须要使得你做的事情有所变化,这样才能有更普适的能力。

用代表不同情形的数据来训练一个机器学习模型是至关重要的一点。

如果你想教那个外星人朋友椅子长什么样,就需要保证提供给他不同类型、不同视角的照片。

下一次当你想学习一项新的技能,尝试尽可能的从不同的视角进行学习。

◆ 不要重新发明轮胎:学会迁移学习

在硅谷你会见到很多换了新的工作领域的人都做得非常好。有建筑师转去做设计师,律师去做销售代表,工程师去做市场营销人员等等。有趣的是,他们都会发现有很多原来工作中的知识可以应用到新的工作。

在人工神经网络(主要用于图像识别)领域有一个叫转移学习的技巧。无须把全部的东西重建,你可以用以前训练过的相似的任务中的一部分放入新的任务。不难想象,这会帮助提高模型的表现并能节省很多时间。

回想吉他演奏家的例子——如果你已经知道如何弹钢琴,可能对你来说学吉他就会容易很多。虽然是完全不同的乐器,但基础的音乐素养是普适的。

最重要的是学会利用大脑中已经建立的联系,将其应用于不同的技能当中。

就像滑板的技能可以应用于滑雪板一样。

通过应用已知的知识,你可以快速的上手新的东西。

机器学习不是什么新东西,已经有几十年了。这是一个缓慢的过程,而且现在逐渐开始可以看到回报了。现在我们有资源来创造一个巨大的影响。上一周我参加Gigaom AI 2017 会议,Jerry Kaplan形容说,从历史上看,我们现在的这是时代可以和犹如之前轮子的发明发明轮子的革命般相提并论。

既然你有一个大概的概念这些神秘的黑箱是如何运作的,我鼓励你去探索一下AI。我们不仅仅需要工程师和数据科学家,我们还需要懂得这幕后是如何运作的、并将这科技的力量应用于新的领域的人们。

“AI是下一个犹如电的的发明般的存在,并会一直不断的对一个又一个的行业进行转变。

——Andrew Ng”

来源:https://medium.com/tradecraft-traction/maximize-your-learning-how-to-apply-machine-learning-practices-into-your-own-life-e31cca9309e8#.ecwno2l6s

关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-03-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯研究院的专栏

何为实在

image.png 推荐语: 霍金的《大设计》(The Grand Design)与其说是本科普读物,莫如说是相关“实在与终极”的著作。过去几千年间,...

2565
来自专栏机器之心

人物 | Geoffrey Hinton的成功之路:从神经网络黑暗时代的坚守到今天的胜利

选自The Globe and Mail 作者:Jeff Gary 机器之心编译 参与:吴攀、黄小天、Ellen Han 深度学习泰斗 Geoffrey Hin...

2394
来自专栏AI研习社

深度学习真的可以零基础入门吗?

我们先来谈谈自学深度学习最大的问题。 现在搞深度学习的,十之八九并不是“科班出身”。 这就导致:如果你想要跨行成为一名深度学习工程师,从头到尾的一切,都基本靠自...

3575
来自专栏机器学习算法与Python学习

走近Hinton:AI教父传奇人生

三十多年以来,Geoffrey Hinton一直都处于人工智能研究的边缘地带。他像一个局外人一样坚守着一个简单的观点:计算机可以像人类一样,依靠直觉而不是规则进...

973
来自专栏PPV课数据科学社区

人工智能革命:为什么深度学习会突然改变你的生活?(上)

? 编者按:过去4年,大家无疑已经注意到大范围的日常技术在质量方面已经取得了巨大突破。这背后基本上都有深度学习的影子。到底什么是深度学习?深度学习是如何发展到...

3758
来自专栏LET

最美的理论(下篇)

1476
来自专栏PPV课数据科学社区

【工具】R语言学习参考图书不完全指南

这里大部分都是英文的书。国内对于R的书籍的翻译中文几乎可以忽略的说。 1.入门级读物 R的帮助文档中提供了一些入门的读物,比如《Anintroduction t...

2343
来自专栏Vamei实验室

统计Go, Go, Go

结束了概率论,我们数据之旅的下一站是统计。这一篇,是统计的一个小介绍。 统计是研究数据的学科。它包括描述数据,推测群体信息,判断假设的真伪。统计是一门实用学科。...

1819
来自专栏新智元

【AI万圣节】MIT发布首个AI鬼故事作家,RNN和在线学习算法生成恐怖小说

【新智元导读】继去年“机器学习生成恐怖图像”后,MIT研究人员在今年的万圣节推出了“AI写恐怖故事”的项目,利用RNN和在线学习算法,结合Reddit上人类写的...

3237
来自专栏新智元

AI编曲震撼人心,RNN生成流行音乐(视频)

【新智元导读】AI 和音乐的结合已经成为一个新兴的行业,AI 编曲的《Free Break》风靡一时,它的成功,在于“AI+HI”的合作。 由 AI 编曲的《F...

4385

扫码关注云+社区

领取腾讯云代金券