解读深度学习 Deep Learning的特点,这样学起来更简单

写在前面

传统的机器学习,使用手写特征提取和模态特定的机器学习算法来标记图像或识别语音。然而,这种方法在解决时间和精度上都有一些缺点。当今先进的深度神经网络使用算法,大数据和GPU的计算能力来改变这种动态。机器现在能够以快速,精确和规模的方式进行学习,这正在推动真正的人工智能和人工智能计算。现在来盘点下深度学习有哪些特点方便理解

分布式表示

分布式表示背后的想法是 - 观察到的信息是多层次因素的组成。在深度学习中,神经网络在不同的隐藏层上处理这些因素。例如,如果信息中显示“黑色丰田”,那么这些因素可以是汽车的颜色,型号名称,形状等。在隐藏层的每一层,神经网络都会处理这些因素。但实际上,没有人知道神经网络如何将信息分解成因子。下面的图片让你了解这些功能是什么:

因此,这有时是无监督学习的最佳选择。

自动特征工程

特征是任何对预测有用的信息。例如,用于语音识别的语音片段,用于NLP的文本,用于计算机视觉的图像等。特征工程是指将特征设计为用于机器学习的合适格式的一组任务。它的过程需要一个高效地创建功能,使用它们,检查可能的改进,并重复这个循环。这也需要对分析的主题有很好的了解。特征工程到目前为止工作很出色。但是像许多方法和技术一样,在面对大数据时也是无能为力的。它无法在当今正在生产的大量数据上工作。特征工程中的数据越大,成本越高。所以,这是一个昂贵且耗时的过程。因此,对于大数据可能不会太有利。另一方面,深度学习不需要手动特征工程; 它配备了自动特征工程。它将数据转换为中间表示,消除了特征工程的必要性。所以,你不必浪费时间设计和转换功能,几小时/天。在当今数据爆炸的时代,特征工程正在迅速变得过时。因此,深度学习的需求比以往更为重要。

抽象

深度学习从不同层次的抽象中学习。“抽象”的概念没有明确的定义。理解这一点的一个方法是计算机在每个隐藏层获得的直觉/知识。隐藏层数越多,抽象层次越大。由于这个概念,深度学习是一个相当模糊的模型。没有适当的统计估计或有效性检查。这个概念来源于大脑的功能。出于同样的原因,它会产生不同的结果,这些结果有时是出色的(如语音识别),有时甚至是不可理解的。

大数据

深度学习需要大量的数据来补充其庞大的网络。否则,它会遭受过度配合。它也用于无监督的学习。在当今时代,没有标签的数据爆炸了。深度学习擅长处理未标记的数据。与其他工具不同,它只需要标记数据的一小部分。它从这个数据中学习。因此,深度学习是无监督大数据学习的最佳选择。

无监督学习

即使深度学习可以产生出色的结果,有时候,它们也可以是任意的。没有特定的测试来检查这种无监督学习的有效性。因此,深度学习并不总是百分之百可靠和准确。

过度配合

当用小数据集进行训练时,深度学习会遭受许多过度拟合。尽管自动特征工程,过度配合是一个令人不安的现象。正则化(l1,l2和dropout)有助于对模型进行概括,从而减少过拟合。

花费时间

由于有很多超参数要调整(隐藏层,隐藏单元等),因此深度学习需要很长时间来计算。深度神经网络是如此统一的结构,使得在网络的每一层,人造神经元执行几乎相同的计算。它涉及大规模的并行计算。并行计算的这个要求是通过GPU(即图形处理单元)的应用来实现的。传统的低并行性和低时钟速度的CPU在经济上是不可行的。为了比较速度,最好的CPU有大约50 GBps,而最好的GPU有750 GBps的内存速度。

理论基础

神经网络没有很强的理论基础。它们是从人脑细胞中复制出来的,甚至不是一个完全相同的复制。事实上,没有人知道神经网络中的知识是如何组织的。抽象的概念仍然是模糊的。对这种学习没有适当的统计估计。估计我们的预测的标准误差和模型的拟合度是很困难的。因此,即使结果是非常有希望的,这是一个黑匣子,在这个领域还有很多工作要做,才能真正理解。

结语

深度学习尚处于起步阶段。尽管是一个大量使用的工作模式,但实际的工作仍然是未知的。这也是一个耗费大量神经网络的时间模型。因此,对于大量的数据,它消耗更多的资源。但是,大数据对深度学习有正面的影响(不能过度使用)。随着硬件性能上限的日益增加,深度学习的应用也越来越可行。随着该领域的大型企业对该领域的兴趣越来越大,以及正在开发的尖端技术(如量子计算),深度学习前景非常广阔。深度学习已经引起了全世界的关注,并取得了出色结果。

参考

KAVERI PRIYAMBADA

Airesearch

Rsipvision

on-demand

upxacademy

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180108A0P20000?refer=cp_1026

扫码关注云+社区