机器学习和深度学习的区别

近来有一些朋友问我,深度学习是不是算机器学习,如果是为什么一定要单拿出来算一个概念,那我在这就说说我的理解。

首先,深度学习确实仍然是依靠机器来做学习的不管是监督、半监督、还是其它学习,所以从这个角度来说深度学习是算作机器学习范畴的。

但是,与传统的机器学习概念不同,深度学习其背后原理的解释性非常差,我们来做个比较。

以传统机器学习中的监督学习为例,朴素贝叶斯实现的是概率量化计算的模型,它的解释是先后验概率的量化关系。决策树实现的是通过维度条件来降低分类的信息熵,这是基于信息熵解释的模型。回归模型是通过建模和拟合来确定待定系数,目的是在不过拟合的情况下降低残差。SVM是通过超平面来分割不同类距离超平面距离最优化的统计学模型……这些模型的物理解释非常明确,有着清晰的含义。当然,向量的维度数量和维度值是一定要由我们人类来归纳量化的。

深度学习与此不同的是,它通过大量的线性分类器或非线性分类器、可导或不可导的激励函数、以及池化层等功能对观测对象的特征进行自动化的提取。而在训练中寻找到的参数w矩阵中的权值早已没有了统计学中的权值的权重意义,无法得到清晰的物理解释,也无法进行逆向研究。用这种方式训练出来的模型最后在做业务改进的时候是没有方向感的,只知道输入新的情景向量x之后业务效果有提高,但是不知道为什么。所以深度学习的模型训练得再好也只能当成一个黑匣子来使用,它之所以能够被认定为科学的方式还是因为它的泛化性能够在验证集上通过来做保障这一点。这才是两者最大的不同,也是研究人员不愿意把两者放在一起无差别研究的重要原因。

目前深度学习的工作还差强人意的原因有这样几个:

1、计算的复杂性太高,计算成本太高,也就导致训练的时间太长,商用价值无法在很多场景抵偿商用成本。

2、底层的研究人员还是非常缺乏,没有本质性的理论突破,所以也就没办法缩短应用落地的时间。

3、建模能力仍然是一个大问题。虽然在深度学习中,特征提取已经越来越多地被计算机自动去做了,但是这个提取过程中有大量试错的过程会给计算机带来很多不必要的计算压力。这些对象的特征提取通过人的其它付诸手段是可以降低其计算复杂性的。

不过说到底,距离理想的人工智能的状态,硬伤还是在问题1上,这恐怕需要大量的时间积累,理论的积累,经验的积累,人才的积累,总有一天我们会等到人工智能奇点爆炸的时刻的。

原文发布于微信公众号 - 奇点(qddata)

原文发表时间:2016-10-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数说工作室

logistic回归:从生产到使用【上:使用篇】

logistic回归:从生产到使用【上:使用篇】 前面介绍过几个算法,如KNN、决策树等(在微信公众号“数说工作室”中回复“jrsj”查看,不要引号),都可以用...

4016
来自专栏企鹅号快讯

人工智能与机器学习有哪些不同

每天读一篇一线开发者原创好文 来自:51CTO.COM,作者:RickyHo,刘妮娜译 链接:http://network.51cto.com/art/2017...

3020
来自专栏GAN&CV

为什么深度学习几乎成了计算机视觉研究的标配?

本文转载自:https://zhuanlan.zhihu.com/p/21533690

1822
来自专栏新智元

【深度学习并非万能】全方位对比深度学习和经典机器学习

近年来,深度学习已成为大多数AI问题的首选技术,使得经典机器学习相形见绌。原因很明显,深度学习在语音、自然语言、视觉和游戏等许多任务上都表现出卓越的性能。然而...

3456
来自专栏数说工作室

造出一艘logistic模型 | 【logistic从生产到使用】(上) | 数说 · 算法

前几天飞扬博士更新了一篇算法文章,关于softmax regression的,它是logistic模型的扩展,因此要是能有些logistic regressi...

3665
来自专栏ATYUN订阅号

OpenAI:通过无监督学习提高语言理解能力

研究者通过一个可扩展的,与任务无关的系统获得了一系列不同语言任务的最新成果,这一系统也即将发布。此方法结合了两种现有的想法:Transformer和无监督的预训...

1254
来自专栏AI科技评论

学界 | 迁移学习效果优化不再是难题,杨强教授团队带来自动找到最佳算法的L2T

AI 科技评论按:近日,香港科技大学杨强教授团队发表了一篇关于迁移学习的论文。在论文中,他们提出了一种新颖的迁移学习范式 Learning to Transfe...

3398
来自专栏腾讯开源的专栏

腾讯将添 AI 开源项目! 腾讯 AI Lab 开源业内最大规模多标签图像数据集

2018年9月10日,深圳 - 今日,腾讯AI Lab宣布将于9月底开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images...

1182
来自专栏人工智能

看完这些你就明白,机器学习和深度学习的根本区别了

深度学习是什么? 在深度学习中,计算机模型学习直接从图像、文本或声音中执行分类任务。深度学习模式可以达到新的精确度,有时甚至超过人类的表现。大多数深度学习方法使...

4978
来自专栏企鹅号快讯

康奈尔博士后黄高:如何设计高效地卷积神经网络

AI 科技评论按:卷积神经网络则是深度学习最具代表性的模型,在计算机视觉和自然语言翻译等领域有着极其广泛的应用。随着精度以及复杂度的逐步提升,卷积网络的推理效率...

3906

扫码关注云+社区

领取腾讯云代金券