前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Peter教你谈情说AI | 02什么是机器学习

Peter教你谈情说AI | 02什么是机器学习

作者头像
刘盼
发布2018-10-24 10:18:09
3570
发布2018-10-24 10:18:09
举报
文章被收录于专栏:人人都是极客人人都是极客

什么是机器学习?机器学习就是:不通过人类直接指定的规则,而是通过机器自身运行,习得事物的规律和事物间的关联。

一个故事说明什么是机器学习

既然机器是有可能自己学习事物规律的,那么如何才能让它学到规律呢? 我们先来看一个故事:

我的一个朋友小Y,他就不是那么守时,最常见的表现是他经常迟到。当有一次我跟他约好3点钟在某个麦当劳见面时,在我出门的那一刻我突然想到一个问题:我现在出发合适么?我会不会又到了地点后,花上30分钟去等他?我决定采取一个策略解决这个问题。

要想解决这个问题,有好几种方法。第一种方法是采用知识:搜寻能够解决这个问题的知识。但很遗憾,没有人会把如何等人这个问题作为知识传授,因此不可能找到已有的知识能够解决这个问题。第二种方法是问他人:去询问他人获得解决这个问题的能力。但是同样的,这个问题没有人能够解答,因为可能没人碰上跟我一样的情况。第三种方法是准则法:我问自己的内心,我有否设立过什么准则去面对这个问题?例如,无论别人如何,我都会守时到达。但我不是个死板的人,我没有设立过这样的规则。

事实上,我相信有种方法比以上三种都合适。把过往跟小Y相约的经历在脑海中重现一下,看看跟他相约的次数中,迟到占了多大的比例。利用这来预测他这次迟到的可能性。如果这个值超出了心里的某个界限,那就选择等一会再出发。假设我跟小Y约过5次,他迟到的次数是1次,那么他按时到的比例为 80%,我心中的阈值为70%,我认为这次小Y应该不会迟到,因此我按时出门。如果小Y在5次迟到的次数中占了4次,也就是他按时到达的比例为20%,由 于这个值低于我的阈值,因此我选择推迟出门的时间。这个方法从它的利用层面来看,又称为经验法。在经验法的思考过程中,我事实上利用了以往所有相约的数据。因此也可以称之为依据数据做的判断。

再把这个故事深度发挥一下,假设我把时间作为自变量,譬如我发现小Y所有迟到的日子基本都是星期五,而在非星期五情况下他基本不迟到。于是我可以建立一个模型来模拟小Y迟到与否跟日子是否是星期五的概率。见下图:

这样的图就是一个最简单的机器学习模型,称之为决策树

再复杂一点,假设小Y的迟到跟天气也有一定的原因,如果我希望能够预测小Y迟到的具体时间,我可以把他每次迟到的时间跟雨量的大小以及前面考虑的自变量统一建立一个模型。于是我的模型可以预测值,例如他大概会迟到几分钟。这样可以帮助我更好的规划我出门的时间。在这样的情况下,决策树就无法很好地支撑了,因为决策树只能预测离散值。我们可以以后课程会介绍的线型回归方法建立这个模型。

所以,机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。

有监督学习 vs 无监督学习

有监督学习

上图可以当做分辨老鼠的“老鼠分类器“,每一张照片是一个数据样本(Sample)。下面对勾或者叉子,就是这个数据样本的标签(Label)。而给样本打上标签的过程,就叫做标注(Labeling)。标注这件事情,机器学习程序自己是解决不了的,必须依靠外力。

这种通过标注数据进行学习的方法,就叫做有监督学习或直接叫监督学习(Supervised Learning)。

无监督学习

反过来,如果用于学习的数据只有样本,没有标签,那么通过这种无标注数据进行学习的方法,就叫做无监督学习(Unsupervised Learning)

比如说,我们有这样六个样本:

要做的事情是,将根据她们的体貌将区分她们的种族。

明明是六匹马,为什么还要分种族?因为在小马(《Little Pony》)的世界里,小马(Pony)在马这个大类之下,还有细分的种族。

我可以告诉你,要关注的特征(Features)是:独角和翅膀。而她们一共可以被归为3个小马种族。

这样你是不是就能分出来了——两个有独角的一组(她们叫独角兽);两个有翅膀的一族(她们叫飞马);另外两个很正常的一组(她们叫陆马)。

OK!聚类完成。这就是无监督学习的过程。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-10-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人人都是极客 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档