五分钟快速了解深度学习

原作者:Radu Raicea

译者:刘勤

人工智能(Artificial Intelligence)和机器学习(Machine Learning)是当下最热话题。每天“AI”这个词都在耳边横飞。胸怀抱负的开发人员声称想要研究AI;经理们说想在服务中应用AI。但是,通常这些人不知道AI是什么。

本文将带你了解人工智能(AI)和机器学习(ML)的基本知识。你也会了解到机器学习中最火的方法——深度学习的工作原理。

本指南是用来科普的,所以不会涉及高等数学。

背景

了解深度学习的第一步是把握重要概念之间的区别。

AI与ML

人工智能(AI)是在计算机中复制人类智能。

AI研究刚开始时,研究人员尝试复制人类只能来完成特定任务,比如玩游戏。

他们给计算机制订了大量的规则。计算机有一张可能行为的具体清单,并根据制定的规则作出决定。

机器学习(ML)指机器通过大数据集(而不是定死的规则)来学习的能力。

机器学习允许计算机自主学习。这种类型的学习利用现代计算机的处理能力,可以轻松处理大型数据集。

监督学习与无监督学习

监督学习使用标记过的数据集,有输入和预期的输出。

如果使用监督学习来训练AI,你要给它一个输入并告诉它预期的输出。

如果AI产生的输出错了,它会重新调整它的计算。这个过程是通过遍历数据集完成的,直到AI不再犯错。

监督学习的一个例子是天气预报AI。 它通过历史数据来学习预测天气。训练数据有输入(气压,湿度,风速)和相应的输出(温度)。

无监督学习是使用没有特定结构的数据集进行机器学习。

如果使用无监督学习训练AI,就是让AI对数据进行逻辑分类。

无监督学习的一个例子是电子商务网站的行为预测AI。它不用通过标记数据集来学习。

相反,它会自己对输入数据创建分类。它会告诉你哪种用户最有可能购买这款产品。

那么,深度学习是如何工作的?

现在,你已经具备了理解深度学习工作原理的基本知识。

深度学习是一种机器学习方法,可以通过一组输入,训练AI来预测输出。监督学习和无监督学习都能用来训练AI。

我们将通过建立一个假想的机票估价服务来了解深度学习是如何工作的。我们将使用监督学习方法进行训练。

我们希望机票估价工具能够使用以下输入来预测价格(方便起见,不包括返程票):

• 始发机场

• 到达机场

• 起飞日期

• 航线

神经网络

来看看人工智能大脑的内部构造。

和动物一样,估价AI的大脑也有神经元,用圆圈来表示。这些神经元是互相连接的。

这些神经元被分成三层:

1、输入层

2、隐藏层

3、输出层

输入层用来接收输入的数据。在我们的案例中,输入层有四个神经元:始发机场、到达机场、起飞日期和航线。输入层把输入传递到隐藏层的第一层。

隐藏层对输入数据进行数学计算。建立神经网络的一个难题就是如何决定隐藏层的数量以及每一层的神经元个数。

深度学习中的“深”指的是神经网络有超过一层的隐藏层。

输出层返回输出数据。在本案例中,输出就是价格预测。

那么它如何计算价格预测呢?

这就是深度学习的魔力开始的地方。

神经元之间的每个连接都有相应的权重。这个权重决定了输入值的重要性。初始权重是随机设置的。

在预测机票价格时,出发日期是较重要的因素之一。因此,出发日期的神经元连接将有很大的权重。

每个神经元都有一个激励函数。没有数学推理,这些功能是难以理解的。

简而言之,其目的之一是“标准化”神经元的输出。

一旦一组输入数据通过了神经网络的每一层,它就通过输出层返回输出数据。

没什么复杂的对吧?

训练神经网络

训练AI是深度学习中最难的部分。为什么呢?

1.需要大数据集。

2.需要很强的计算能力。

对于机票价格估算,我们需要找到票价的历史数据。由于可能的机场和出发日期组合数量很大,我们需要一个非常大的票价清单。

为了训练AI,我们需要从数据集中给出输入,并将AI的输出与数据集的输出进行比较。由于AI尚未经过训练,其输出将是错的。

一旦遍历了整个数据集,就可以创建一个函数来显示AI的输出与实际输出的偏差。这个函数被称为代价函数。

理想情况下,我们希望代价函数为零。此时,AI的输出和数据集的输出一样。

如何降低代价函数?

改变神经元之间的权重。我们可以随机改动权重,直到代价函数的值很低。但是这种做法效率很低。

实际上,我们用梯度下降方法。

梯度下降可以用来找到函数的最小值。在本案例中,就是找到最小的代价函数。

梯度下降的原理是,在每次遍历数据集后,稍稍增加权重。通过计算一定权重下的代价函数的导数(梯度),我们可以看出最小值在哪个方向上。

为了使代价函数最小化,需要多次遍历数据集。 这就是为什么需要很强的计算能力。

使用梯度下降更新权重是自动完成的。这就是深度学习的神奇之处!

一旦我们训练了机票估价AI,我们就可以用它来预测未来的价格。

总结

• 深度学习使用神经网络模仿动物智能。

• 神经网络中有三种类型的神经元层:输入层,隐藏层和输出层。

• 神经元之间的联系与权重相关联,决定输入值的重要性。

• 神经元对数据应用激励函数以“标准化”神经元的输出。

• 训练神经网络需要一个大数据集。

• 遍历数据集并比较输出,就会生成一个代价函数,显示AI与实际输出的偏差。

• 在每次遍历数据集后,使用梯度下降来调整神经元之间的权重以降低代价函数。

End.

本文来自企鹅号 - 中国统计网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

CVPR 2018 | 新研究提出深度残差等价映射:由正脸加强侧脸识别效果

选自arXiv 作者:Kaidi Cao等 机器之心编译 参与:李诗萌、白妤昕、思源 由于类别样本不均衡,人脸检测只在正脸识别上有优秀的表现,它们很难识别侧脸样...

38560
来自专栏Albert陈凯

什么是深度学习,几个名词的简单形象通俗解释,让你看就记住

这个故事包含了,有监督,无监督,训练数据集,测试数据集,过拟合 ---- 第一眼看到“学习”,大多数人想到的是读书、上课、写作业,我们就拿它作为切入点。上课时,...

1.4K70
来自专栏专知

【AlphaGo Zero 核心技术-深度强化学习教程笔记06】价值函数的近似表示

点击上方“专知”关注获取更多AI知识! 【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不...

30140
来自专栏SIGAI学习与实践平台

【技术短文】基于深度负相关学习的人群计数方法

同时在本微信公众号中,回复“SIGAI”+日期,如“SIGAI0515”,即可获取本期文章的全文下载地址(仅供个人学习使用,未经允许,不得用于商业目的)。

11240
来自专栏PPV课数据科学社区

【机器学习】目前机器学习最热门的领域有哪些?

目前机器学习最热门的领域有以下七个: 1.迁移学习Transferlearning 简介:一种学习对另一种学习的影响,它广泛地存在于知识、技能、态度和行为规范的...

36990
来自专栏AI科技大本营的专栏

ICML2018见闻 | 迁移学习、多任务学习领域的进展

【导读】如今 ICML(International Conference on Machine Learning,国际机器学习大会)已经成为有巨大影响力的会议,...

23920
来自专栏机器之心

学界 | 微软&中科大提出新型自动神经架构设计方法NAO

从几十年前 [13, 22] 到现在 [48, 49, 28, 39, 8],无人干预的神经网络架构自动设计一直是机器学习社区的兴趣所在。关于自动架构设计的最新...

12310
来自专栏AI研习社

OpenAI“巧妙”发现无监督情感神经元,可利用文本检测用户情感

日前,OpenAI在官网公布了一项新研究成果,介绍了一个可以高效学习情感表征的无监督系统,它能够预测亚马逊评论中的下一个字符。 研究人员采用了线性模型,在一个小...

40290
来自专栏AI科技评论

学界 | 腾讯 AI Lab 详解16篇 ICML 2018 入选论文

7月10日至15日,第 35 届国际机器学习会议(ICML 2018)将在瑞典斯德哥尔摩举行。ICML是机器学习领域最顶级的学术会议,今年共收到2473篇投递论...

17230
来自专栏腾讯高校合作

ICML 2018 | 腾讯AI Lab详解16篇入选论文

22120

扫码关注云+社区

领取腾讯云代金券