深度学习基础指南

人工智能和机器学习是现如今最热门的话题了。

“人工智能”这个词每天被到处乱用。你听到开发者们说他们要学习人工智能。你也会听到管理者说他们要把人工智能技术应用他们的服务中。但他们往往并不了解人工智能。

读完这篇文章,你将会了解到人工智能和机器学习的基础知识。更重要的是你将会了解到最流行的一种机器学习技术——深度学习是如何工作的。

这篇指引是面向大众的,所以文中不会出现高等数学的内容。

背景知识

理解学习深度的第一步是掌握重要术语之间的差异。

人工智能与机器学习

人工智能是人类智能在计算机中的复现。

在人工智能研究的起步阶段,研究人员正试图在计算机上复现人类智能的具体任务 —— 比如玩游戏。

他们引入了计算机需要遵守的大量规则。计算机有一个具体的可能行动清单,并根据这些规则做出决定。

机器学习指的是机器学习使用大数据集而不是硬编码规则的能力。

机器学习允许计算机自己学习。这种学习利用了现代计算机的处理能力,它可以很容易地处理大型数据集。

监督学习与无监督学习

监督学习涉及使用具有输入和期望输出的标记数据集。

当你使用监督学习训练人工智能时,你给计算机一个输入内容并告诉计算机预期的输出内容。

如果人工智能产生的输出是错误的,它将调整计算方法。这个过程在数据集上迭代完成,直到 AI 不再犯错误为止。

监督学习的一个例子是天气预报人工智能。它学习用历史数据预测天气。训练数据有输入(压力、湿度、风速)和输出(温度)。

无监督学习是使用没有特定结构的数据集进行机器学习的任务。

当你使用无监督学习训练人工智能时,你让人工智能对数据进行逻辑分类。

无监督学习的一个例子是一个电子商务网站的行为预测人工智能。它不会通过使用标记的输入和输出数据集来学习。

相反,它将创建自己的输入数据分类。它会告诉你哪种用户最有可能购买不同的产品。

那么,深度学习是怎样工作的?

现在你有了足够的预备知识去理解深度学习是什么,以及深度学习是怎样工作的。

深度学习是一种机器学习的方法。深度学习允许我们训练一个人工智能系统通过给定一个输入数据集,去预测输出数据。监督和无监督学习都可以运用到训练人工智能上。

我们将会通过一个飞机票价评估服务来学习深度学习是如何工作的。我们会使用监督学习方法来训练这个系统。

我们希望我们的飞机票价评估系统通过以下数据来预测票价(为了系统的简单,我们没有使用返程票价的数据):

  • 始发机场
  • 目的地机场
  • 启程日期
  • 航空公司

神经网络

让我们看看人工智能的大脑。

像动物一样,我们的评估系统 AI 的大脑有神经元。它们以圆圈表示。这些神经元之间相互连接。

神经元被分成三组不同的层级:

1、输入层

2、隐含层

3、输出层

输入层接收输入数据。在我们的例子中,输入层有四个神经元:始发机场、目的地机场、启程日期和航空公司。输入层将输入传递给第一个隐含层。

隐含层对输入数据进行数学计算。创建神经网络所面临的挑战之一是决定隐含层的数目,以及每个层的神经元数目。

深度学习中的“深度”指的就是因为它有一个以上的隐藏层。

输出层返回输出数据。在我们的例子中,它给了我们对于价格的预测。

那么深度学习系统如何给出对于价格的预测呢?

这就是深度学习的魔力所在。

在每个神经元之间都有一个“权重”。这个权重描述了输入数据的重要性,初始权重是随机设置的。

当预测机票价格的时候,启程日期是一个重要的因素。因此,启程日期神经元连接将会有高的权重。

每个神经元都有一个激活函数。如果没有数学推到,这些函数很难理解。

简单来说,激活函数的目的是标准化来自神经元的输出。

一旦一个数据集被传入到神经网络的所有的层,激活函数将通过输出层返回数据。

这没什么难的,对吧?

训练神经网络

训练人工智能是深度学习中最困难的部分。为什么?

1、你需要一个很大的数据集。

2、你需要强大的计算能力。

对于我们的机票价格估计系统,我们需要找到机票价格的历史数据。由于机场和起飞日期的可能组合有很多,因此我们需要一个非常大的机票价格清单。

为了训练人工智能,我们需要从数据集中输入它,并将其输出与数据集的输出进行比较。由于人工智能还未经训练,其输出将是错误的。

一旦我们完成了整个数据集,我们就可以创建一个函数,告诉我们人工智能系统的输出与我们需要的输出的差距有多大。这个函数叫做成本函数。

理想情况下,我们希望我们的成本函数为零。这要求人工智能的输出数据和数据集的输出数据完全相同。

如何降低成本函数?

我们可以改变神经元之间的权重。我们可以随机地改变权重,直到我们的成本函数是低的,但这个方法效率不高。

相反,我们将使用一种称为梯度下降的技术。

梯度下降是一种允许我们找到函数最小值的技术。在我们的例子中,我们在寻找最小的成本函数。

它通过在每次数据集迭代后以较小的增量改变权重。在一定的权重集上通过计算成本函数曲线的导数(或梯度),我们可以看到降低成本函数的方向是什么。

为了最小化成本函数,你需要多次迭代你的数据集。这就是为什么你需要大量的计算能力。

使用梯度下降调整权重是自动完成的。这就是深度学习的魔力!

一旦我们训练了我们的机票价格估计AI,我们就可以用它来预测机票未来的价格。

哪里可以学到更多深度学习知识?

还有许多其他类型的神经网络:用于计算机视觉的卷积神经网络和用于自然语言处理的递归神经网络。

如果你想学习深度学习的技术方面,我建议你参加一个在线网络课程。

目前,学习深度学习最好的课程是吴恩达(Andrew Ng)的深度学习课程。如果你对获得证书不感兴趣,你不需要为课程付钱。你可以免费旁听。

如果你有任何的问题,或者需要更多的技术概念的解释,请在下面询问。

总结

  • 深度学习利用神经网络来模仿动物的智力。
  • 一个神经网络钟有三种类型的层级神经元:输入层,隐含层和输出层。
  • 神经元之间的联系与权重有关,权重来指示输入值的重要性。
  • 神经元在数据上应用一个激活函数来“标准化”神经元的输出。
  • 训练一个神经网络,你需要一个很大数据集。
  • 迭代数据集和比较输出将产生一个成本函数,表明人工智能与实际输出有多大的差距。
  • 每次迭代后,通过梯度下降调整神经元之间的权值,降低代价函数。

原文发布于微信公众号 - 奇点(qddata)

原文发表时间:2018-06-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能

深度学习的局限性

本文改编自我的书"Deep Learning with Python(用Python深度学习)"中第9章第2节( Manning Publications 出版...

59511
来自专栏机器之心

学界 | 在线深度学习:在数据流中实时学习深度神经网络

3486
来自专栏机器之心

专栏 | 阿里 AI LAB ICCV 2017 录用论文详解:语言卷积神经网络应用于图像标题生成的经验学习

3627
来自专栏机器之心

AAAI 2018 | 如何高效进行大规模分类?港中文联合商汤提出新方法

3948
来自专栏目标检测和深度学习

腾讯数平精准推荐 | OCR技术之检测篇

在过去的数年中,腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据分析及挖掘等领域的技术研发与落地。特别是在广告推荐领域,团队自...

5804
来自专栏机器之心

业界 | 谷歌提出移动端AutoML模型MnasNet:精度无损速度更快

卷积神经网络(CNN)已被广泛用于图像分类、人脸识别、目标检测和其他领域。然而,为移动设备设计 CNN 是一项具有挑战性的工作,因为移动端模型需要体积小、速度快...

994
来自专栏计算机视觉战队

小心深度学习这个“坑”(入门误区详细版)

定位:深层学习在哪 1、深层学习需要什么? 数学 线性代数:是有关任意维度空间下事物状态和状态变化的规则。 概 率:是用来衡量我们对事物在跨时间后不...

3676
来自专栏大数据文摘

LeCun、Bengio、Hinton三巨头曾合体,Nature发文综述深度学习(论文精华)

4264
来自专栏AI科技大本营的专栏

技术 | 入门机器学习必须知道的6件事,你可未必都了然于心了

翻译 | AI科技大本营(rgznai100) 参与 | shawn 过去两年中,我曾经多次折服于机器学习的魅力。但每当我决定尝试新事物时,经常会不得不重新学习...

3729
来自专栏AI科技评论

学界 | CVPR 2018论文解读:让神经网络学习比较来实现少样本学习

方法非常简单通用,但效果很不错,在少样本学习及零样本学习的几个基准数据集上都取得了相当好的结果。

1523

扫码关注云+社区

领取腾讯云代金券