深度学习究竟是个啥?

深度学习已经在计算机视觉、语言识别和自然语言理解等多个科学领域取得了巨大的成就。深度学习的概念源于人工神经网络的研究,包含一个多隐层的多层感知器。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征。

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。

深度学习概念的提出,是基于深度信念网络(DBN)提出非监督贪婪逐层训练算法,为解决深层结构相关的优化难题。深入研究深度学习,发现其包含三个核心概念:多层组合、端到端的学习和分布式表示。

多层组合

多层表示更符合人类的学习方式,神经网络作为其中的一种,可以从一个单一的感知输入中产生多种理解,例如一个单词的发音。当前的多数分类、回归等学习方法为浅层结构算法,一般只有一层表示,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。

深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。

端到端的学习

深度学习是一种端到端的学习方式,整个学习过程中不需要中间的和显著的人类参与。直接把海量数据投放到算法中,让数据自己说话,系统会自动从数据中学习。从输入到输出是一个完全自动的过程。

分布式表示

分布式表示背后的想法是,观察到的信息是众多因素协同工作所产生的结果。它将堆积如山的数据转化为数据流的组合。通过这种方式,你需要将所有数据存储到一个单一的存储单元中,新数据加入的时候,需要加载数据单元的整个负载。

深度学习是关于自动学习要建模的数据的潜在分布的多层表达的算法,它利用空间相对关系减少参数数目以提高训练性能。算法自动的提取分类需要的低层次或者高层次特征,深度学习能够得到更好地表示数据的特征,同时由于模型的层次、参数很多,能够具备足够强的表示能力。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181017G1L1U900?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券