详解机器学习之the Learning Problem

阅读大概需要10分钟

Why do we learn Machines Learning

之前虽然学过逻辑回归LR,支持向量机SVM等机器学习的零星小片段,还有深度学习也做过很多事情。但是总觉得该抽点时间系统的学习下机器学习了,要不总觉得缺点啥。刚好,自己有视频资料,其实b站上也有,如果你们想学可以给我要视频资料,也可以去b站上看。

咱们先说下深度学习和机器学习的关系,深度学习属于机器学习,但是深度学习自己都快成了一个独立的分支了,因为对于它的研究已经基本超过其他机器学习了,比如现在的计算机视觉或者自然原因处理的论文,如果你没有用到深度学习,那基本都把你pass掉了。

话又话又说回来,有人说深度学习这么火了,为什么还要学机器学习呢?我觉得原因有三点:

  1. 深度学习虽然火,但是现在也只能算是刚兴起,工业界用的最多的目前还是机器学习和以前传统的方法。
  2. 如果想用到深度学习,那基本是你的数据量特别庞大的时候。但是现在很多公司数据量没有那么庞大,只用普通的方法就行。
  3. 机器学习理论还是很值得我们探索的,即使有些方法我们或许用不上,但是它的推导和核心的思维方式或许能帮我们打开很多视野,也能帮助我们迅速理解以后突然出现的新的方法。说实话,每天都会有上百种新的机器学习方法的提出,只要掌握了机器学习的基础,那就。。嘿嘿 一句话,万变不离其宗O.O

---仅属于个人理解

好啦,我们开始啦。

导读

为了详细学习机器学习的基石,我们总体大纲会从四个大方面讲解(这次和以后):

1.在什么情况下我们可以用机器来学习?

2.为什么机器可以学习?

3.机器怎么学习?

4.机器怎么能学习的更好?

即:

本章我们会围绕着第一个讲解:

在什么情况下我们可以用机器来学习?

那么在这节中,我们将会会以下面四个小方向来讨论:

  1. 什么是机器学习?
  2. 机器学习的应用有哪些?
  3. 机器学习的要素有哪些?
  4. 机器学习和其他的相关领域

即:

What is Machines Learning

我们先说learning:

在我们很小的时候从叽叽呀呀到在一岁左右开始学喊爸爸妈妈,再到后来的吞吞吐吐说话,最后到都nb的开始学习人家的国外的语言了。我们的这个过程就是一个最最简单的learning的过程,是在不断学习别人的过程。

大概概括就是,人通过观察,不断地学习不断地累计经验的过程。

那么Machines Learning是怎么回事呢?

机器不是生物,没有意识,那么怎么能学习呢?对,那就是data,我们通过喂给机器数据,让机器来学习其中的规则,获取相应的技能的过程。

那么什么是技能skill呢?

提高某种表现形式(比如准确率呀等)

而Machines Learning也是这么个过程:

比如一些实例应用:

炒股票,有个任务让你根据最近几年的股票来预测这个时刻,我是该买呢?还是该卖?那你可肯定得需要很长时间来考虑和计算了。但是如果把

data给了机器,让data预测,那都是分分秒的事。

比如我们要弄个机器人去火星,因为我们人类没去过,所以,我们不能给机器传输一些我们知道的规则,那就需要机器自己到火星上去学习。

比如有一个应用,识别树,你通常会先想你是怎么定义树的,但是这个是比较难的,我们当时刚出生的时候,难道爸妈告诉我们那个绿的,高的,长得那个样子等等的是树吗?显然不是。那么我们是这么学的呢?对了,我们是通过观察,累计经验的,所以,我们需要用机器学习,让机器自己学习特征来判别。

当这几种情况的时候,我们可以使用机器学习:

  1. 当人类不能人工的编写这个系统的时候
  2. 当人类不能很容易的定义这个问题的时候
  3. 当需要快速做出决定而人不能的时候
  4. 当需要为客户做定向服务的时候

etc.

授之以渔,而非授之以鱼。

那么到底问题应该具备哪些特定的元素才能用机器学习呢?

  1. 有潜藏的规律的
  2. 不能简单的用程序定义的
  3. 有data,也就是有input

那咱们做几道题把,看看哪些可以用到机器学习?

回答:

  1. 孩子哭泣无规律呀,所以pass
  2. 圆的规律太明显,直接编程即可,pass
  3. 这个可以:a.有pattern即客户的行为,b.很难用程序来定义,c.他的历史银行运作信息
  4. 这个。。没有足够的数据啊。(庆幸没有足够数据O.O)

Applications of Machines Learning

这里就很多啦,比如我们的衣食住行中的例子:

  1. 食:根据Twitter上的数据来预测饭店的好坏
  2. 衣:根据销售数字和顾客调查来给顾客推荐衣服
  3. 住:根据建筑的特征和他们建筑时的消耗预测其他建筑得消耗
  4. 行:根据一些交通信号的图片和它的意义来准确预测在行进时对交通信号的判定,比如现在火的智能驾驶

其他的比如在学生教育上面:

对学生历年来答题的数据进行学习,来预测学生在某道题上是否能答对。

在娱乐方面:

从用户评价过的电影中学习,可以给用户推荐电影。

针对这些还有很多比赛:

那么比如电影推荐系统怎么做呢?

如图所示(简化描述,现实肯定没这么简单):

我们用一个数组表示客户的喜好,比如第一个表示喜欢喜剧?第二个表示喜欢动作片?等

另一个数组表示电影的特征,比如第一个喜剧的内容,第二个表示动作片的内容等

这两个数组的数据要对应,一个是喜欢喜剧?那么另一个就是喜剧内容。最后都以分值得形式呈现,对应位相乘在一起,最终得分高的就是推荐的。

Components of Machines Learning

那么具体的机器学习什么元素呢?现在就来讲讲

比如我们为一个客户判定该不该给客户申请信用卡?

我们有的信息只有他们填表的时候的信息

那么我们来说下机器学习到底具体需要什么以及怎么个流程:

input x:用户信息

output y:预测申请卡的好坏

目标函数f:f(x)=y

而data就是每个用户y的信息x的集合

假设函数g:机器学习的目标就是缩短和理想的函数f的差距。

公式简化为:

而这是这个流程就为:

H是猜测的所有可能集合,比如:

h1:年收入大于80W(这个可能性最大)

h2:负债大于10W(这个可能性最下)

h3:每年内有小于等于2个工作(不确定)

etc.

g从这个里面选取(也或许是选几个),最终选取正确率最高的当做最终的g函数尽肯能的接近target 函数f:

Machines Learning and Other Fields

机器学习与数据挖掘:

数据挖掘就是通过大量的数据发现有趣的属性,如果这个属性和求得接近于真实函数f的假设g过程一样,那么机器学习和数据挖掘就是一样的;如果这个属性和求得接近于真实函数f的假设g过程相似则数据挖掘可以帮助机器学习;但是在数据方面,它俩是一样的。

机器学习与人工智能

在追求g趋近于f上这俩是相似的,而对于比如下棋来说,就有两种方法,一种是传统的,一种是机器学习。总的来说,机器学习是实现人工智能的一种方法。

机器学习与统计

统计可以实现机器学习;传统而统计可以用来数学预测,但是在计算上就欠佳了。总之,统计中的很多方法适用于是机器学习的实现。

Summary

一图胜千言:

每日托福单词

vague adj. 含糊的,不明确的

immune adj. 免疫的

resemble v. 相似,类似

spin v.旋转 n. 旋转

resolve v. 解决 n. 坚决,决心

原文发布于微信公众号 - 深度学习自然语言处理(zenRRan)

原文发表时间:2018-04-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界 | DeepMind解密黑箱的第一步:原来神经网络的认知原理和人类是一样的!

AI 科技评论按:因为AlphaGo而名声大噪的人工智能公司DeepMind近期发表了一篇论文介绍自己在神经网络的解释性问题上最新探索。论文被ICML接受后,D...

3317
来自专栏AI研习社

学不学吴恩达 deeplearning.ai 课程,看完这篇你就知道了

AI 研习社按:本文的作者是 Thomas Treml,是一名具有社会学背景的数据科学自由职业者。他在 Medium 上分享了自己学习 deeplearning...

1061
来自专栏云时之间

深度学习与神经网络:浅谈人工神经网络跌宕起伏七十年

人工神经网络在过去的七十年的时间里数次起起伏伏,几十年间人们一直在追求机器的智能化,在近几年的研究中,随着数据量的增加和深度学习神经网络算法的研究和进步,表明了...

47811
来自专栏企鹅号快讯

转行数据挖掘和机器学习(四)

目前从纯数学专业转行到机器学习领域已经有两年半了,又到了该总结转行经验和个人成长的时候。笔者在公司里面已经做过智能推荐系统,智能安全系统和智能运维系统。除此之外...

2108
来自专栏人工智能头条

Transfer learning在知心商业广告点击率预估中的应用

2994
来自专栏机器之心

SIGIR 2018 | 通过深度模型加深和拓宽聊天话题,让你与机器多聊两句

选自sigirdawnet 作者:Wenjie Wang等 机器之心编译 参与:Panda 目前大多数基于生成的对话系统都会有很多回答让人觉得呆板无趣,无法进行...

3585
来自专栏云时之间

深度学习与神经网络学习:(1)小小的开始

大家好,这一篇文章算是深度学习这一个开始 其实说深度学习,之前或多或少之前也学过一些,比如像经常在TensorFlow用的CNN卷积神经网络和RNN递归神经网络...

4496
来自专栏AI科技大本营的专栏

老司机这样讲深度学习,新手才能看得懂学得快

作者 | 张玉宏 (一)一入侯门“深”似海,深度学习深几许 【导言】目前人工智能非常火爆,而深度学习则是引领这一火爆现场的“火箭”。于是,有关“深度学习”的...

3195
来自专栏新智元

机器学习里,数学究竟多重要?

【新智元导读】本文的主要目的是提供资源,给出有关机器学习所需的数学上面的建议。数学初学者无需沮丧,因为初学机器学习,并不需要先学好大量的数学知识才能开始。正如这...

41610
来自专栏AI科技评论

学不学吴恩达deeplearning.ai课程,看完这篇你就知道了

AI 科技评论按:本文的作者是 Thomas Treml,是一名具有社会学背景的数据科学自由职业者。他在 Medium 上分享了自己学习 deeplearnin...

1373

扫码关注云+社区

领取腾讯云代金券