漫画:什么是机器学习?

感谢作者 玻璃猫 (订阅号 梦见 ID dreamsee321) 投稿,如需转载,请与作者联系授权事宜。

在一个风和日丽的周末......

故事一:瑞雪兆丰年

我们中国有一句关于农业生产的古老谚语:瑞雪兆丰年。

就是说,如果前一年冬天下雪很大很多,那么第二年庄稼丰收的可能性比较大。

这条谚语是怎么来的呢?我们可以想象当时的情景:

第一年冬天

第二年收获时节

第二年冬天

第三年收获时节

第三年冬天

第四年收获时节

年复一年,若干年后的冬天......

这就是瑞雪兆丰年的故事。头年的瑞雪和来年的丰收,本是两个看起来并不相关的现象,但是智慧的农民伯伯通过几十年甚至几代人的经验,总结出了两个现象之间的规律。

故事二:啤酒和尿布

上个世纪90年代,沃尔玛超市已经是美国最大的零售企业,拥有大量的顾客资源。那时候的沃尔玛已经采用了先进的计算机技术,随时记录着每天众多顾客购物车中所挑选的商品明细。

在其中一个普通的日子里:

就这样经年累月,沃尔玛积累了大量的顾客购物数据。直到某一天,沃尔玛的技术专家发现:

于是,这一尝试实行以后......

从此,沃尔玛的销售额得到了显著提升,啤酒尿布的故事也广为流传,成为了销售界和IT界津津乐道的成功典范......

这就是沃尔玛啤酒和尿布的故事。顾客购买啤酒的行为和顾客购买尿布的行为,原本是两个看起来没什么关联的现象。但是沃尔玛的技术专家以大量的用户购物数据为样本,通过先进的算法,最终寻找到了两者之间的重要关联和规律。

为什么购买啤酒的人更有可能同时购买尿布呢?是因为有了小孩的男人比别人更爱喝啤酒?还是因为爱喝啤酒的男人比别人更顾家?这些臆测似乎都有些牵强。

但是沃尔玛不需要关心规律背后的本质。对企业来讲,利用发现的规律,获得实实在在的利益就足够了。

以下是小灰根据个人理解说画的流程图:

以下是大黄基于小灰的流程图所做的补充:

以下是大黄对流程图结果部分作出的调整。其中假设模型可以理解成训练出来的降雪和收获的规律,通过假设模型,从新一年降雪情况推断出下一年收获情况的过程叫做回归。至于啤酒尿布的例子,属于截然不同的机器学习类型,只需要找出关联关系,并不需要进行回归。

机器学习按照方式不同主要分为三大类,有监督学习(Supervised learning)、无监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)。

监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出。在瑞雪兆丰年的例子中,头年降雪量就是输入,来年亩产量就是输出。

非监督学习:直接对输入数据集进行建模,寻找关联。例如啤酒尿布的例子,只需要寻找关联性,并不需要什么明确的目标值输出。

半监督学习:综合利用有输入输出的数据,和只有输入的数据来进行训练。可以简单理解成监督学习和非监督学习的综合。

END

投稿和反馈请发邮件至holly0801@163.com,谢谢!

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2016-11-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

ACL 2016:基于深度学习的 NLP 看点

【新智元导读】计算语言领域顶级会议ACL2016今天公布了10篇优秀论文(outstanding paper)名单。本文介绍 ACL 2016 概况,同时收录清...

5116
来自专栏机器之心

专栏 | 上海纽约大学张峥教授:2017年影响力论文推荐

这篇文章特意选择在 NIPS2017 会议期间发表,但与会者并没有特别大的反应。相反,在研讨会上这篇文章引起了关于通用智能的一场针锋相对的讨论。

1272
来自专栏大数据文摘

周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

1673
来自专栏机器人网

17张思维导图,全面掌握机器学习的统计基础知识

原图下载:https://pan.baidu.com/s/1midnOSC 本文用一系列「思维导图」由浅入深的总结了「统计学」领域的基础知识,是对之前系列文章...

3498
来自专栏CSDN技术头条

用最通俗易懂的方式打开机器学习!

在一个风和日丽的周末...... ? ? ? ? ? ? ? 故事一:瑞雪兆丰年 我们中国有一句关于农业生产的古老谚语:瑞雪兆丰年。就是说,如果前一年冬天下雪...

2176
来自专栏企鹅号快讯

人工智能大数据背后的神秘公式:贝叶斯公式

转自:工业智能化 大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式——贝叶斯公式。它...

6645
来自专栏生信宝典

美女教授带你从统计学视角看转录组分析

分子生物学的中心法则自1958年由Francis Crick提出到今年正好60周年,它描述了“DNA制造RNA,RNA制造蛋白质”的遗传信息的标准流程 [1]。...

3273
来自专栏新智元

麦克阿瑟天才奖得主解码计算机视觉“原罪”:AI 如何认识人类世界

【新智元导读】麦克阿瑟“天才奖”获得者Trevor Paglen训练AI算法,他的展览项目“看不见的图像的研究”(A Study of Invisible Im...

3657
来自专栏AI科技评论

给正在写Paper的你:如何在成千上万的arXiv论文中脱颖而出?

本文为雷锋字幕组编译的技术博客,原标题 Heuristics for Scientific Writing (a Machine Learning Perspe...

3848
来自专栏安恒信息

安恒信息两篇核心AI异常检测论文入选IEEE DSC国际会议

6月18日-21日,“第三届IEEE网络空间数据科学国际会议”在广州召开。业界代表及专家齐聚一堂,并就网络空间数据科学的科研和前沿发展方向进行交流。而安恒信息的...

1914

扫码关注云+社区

领取腾讯云代金券