小心深度学习这个“坑”(入门误区详细版)

定位:深层学习在哪

1、深层学习需要什么?

数学

线性代数:是有关任意维度空间下事物状态和状态变化的规则。

概 率:是用来衡量我们对事物在跨时间后不同状态的确信度。

编程

操作矩阵

实现数学想法

学习的难点

其实就是学习寻找关联函数f的过程。

难点:需要在未见过的任务上表现良好


有一种极端情况:

记忆:记住所有的训练样本和对应标签。


实际:无法被穷尽,各式各样的变体。


关于函数f的寻找


维度的问题:

维度越大,我们越无法获得所有的情况。

面临没见过的情况,一般是将左右的情况平均一下。但是这种方法在高维数据下并不适用。


分布式表达:

原本需要8个不同情况,现在只需要6个。因为8个变体是又3种因素组合而成的。

数字表示法:解决变化的因素。

椭圆这个factor实际上也是有变体的,可以以相同的思路继续拆分,继续降低训练所需数据量。


No Free Lunch Theorem

任何两个优化算法是等价的,当它们的性能是在所有可能的问题的平均值。


深层VS浅层

分布式表达是将变体拆分成因素。但是如果用无限节点的浅层网络,所拆分的变体并不会在不同样本之间形成共享。

而深层神经网络,由于拆分的变体可以在不同样本间共享,在浅层网络中只负责学习自己的关联,而在深层网络中,那些共用相同因素的样本也会被间接的训练到。换句话说,深层的优势在于节省了训练所需的数据量。

关键:因素的共享


深层神经网络

学习的过程是因素间的关系的拆分,关系的拆分是信息的回卷,信息的回卷是变体的消除,变体的消除是不确定性的缩减。

自然界两个固有的先验知识:

并行:新状态是由若干旧状态并行组合形成。

迭代:新状态由已形成的状态再次迭代形成。


应用:如何设计网络

  1. 拆分因素:将变体拆分成因素,降低训练所需数据量。
  2. 因素共享:使所拆分的因素在不同的样本之间形成共享,可以用等量的数据训练出更好的模型。

每一层表示事物的一种状态,设计神经网络时,要以“层”为单元。

  1. 误区1:深层学习并非万能,应用先验知识的前提是数据可以以先验知识的方式生成
  2. 误区2:深层学习没有固定形式,可以依据上两个要点设计出各式各样的网络。

神经网络变体

循环层:时间共享

如果用前馈层,每个圆圈表示100个节点,那么前馈层处理时序相关性时就需要学习300个权重。

但如果知道不同权重在时间下是共享的,那么就只需要学习200个权重。

卷积层:空间共享

如果用前馈层,那么需要学习81个权重,但如果知道这些权重在空间下是共享的,那么可能只需要学习9个权重。原本一张图片在前馈层中只能用于学习一次权重,在卷基层中却可以学习很多次。


设计自己的神经网络

两个方向相加的 双向循环层一般比相并的效果好

  • 神经网络其实并不黑箱,真正黑箱的是你的Task。
  • 设计神经网络就是寻找在你手头的Task上利用因素拆分和因素共享的合理方式
  • 可以先经过前馈层再经过双向循环层再经过前馈层最终得到你的结果。

例子


一些技术

多任务学习muti-task learning,利用的是因素共享,多个任务共享相同的知识,这样就会更容易确定我们真正想要的关联f,而排除掉那些只符合训练数据集,而不符合测试数据集的关联。

joint learningend-to-end learning,是因素共享+因素拆分的联合应用。通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多可以根据数据自动调节的空间,增加模型的整体契合度。


人工智能对我们的影响


原文发布于微信公众号 - 计算机视觉战队(ComputerVisionGzq)

原文发表时间:2018-10-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界 | OpenAI“;巧妙”发现无监督情感神经元,可利用文本检测用户情感

AI科技评论4月7日消息,OpenAI在官网公布了一项最新的研究成果,介绍了一个可以高效学习情感表征的无监督系统,目前能够预测亚马逊评论中的下一个字符。 研究人...

3839
来自专栏计算机视觉战队

小心深度学习这个“坑”(入门误区详细版)

定位:深层学习在哪 1、深层学习需要什么? 数学 线性代数:是有关任意维度空间下事物状态和状态变化的规则。 概 率:是用来衡量我们对事物在跨时间后不...

3686
来自专栏Coding迪斯尼

深度学习:基本概念深度解析

1033
来自专栏AI研习社

关于应用机器学习作为搜索问题的入门简介

应用机器学习很具挑战性,因为设计完美的学习系统相当困难。 一个问题永远没有最好的训练数据集或者最好的算法,最好的只能是目之所及。 机器学习的应用可以理解为一个搜...

3937
来自专栏AI科技大本营的专栏

先搞懂这八大基础概念,再谈机器学习入门!

翻译 | AI科技大本营 参与 | 林椿眄 准备好开始AI了吗?可能你已经开始了在机器学习领域的实践学习,但是依然想要扩展你的知识并进一步了解那些你听过却没有时...

4109
来自专栏新智元

【珍藏】了解CNN这一篇就够了:卷积神经网络技术及发展

【新智元导读】深度学习很火,说起深度学习中一个很重要的概念——卷积神经网络(CNN)似乎也人人皆知。不过,CNN究竟是什么,涉及哪些概念,经过如何发展,真正要有...

3748
来自专栏机器之心

入门 | 吴恩达Deeplearning.ai 全部课程学习心得分享

35011
来自专栏书山有路勤为径

机器学习策略(2)

假设正在调试猫分类器,然后取得了90%准确率,相当于10%的误差,这离希望的目标还很远。看了算法分类错误的例子,注意到算法将一些狗分类成猫。所以这里考虑是否做 ...

932
来自专栏数据派THU

一文读懂深度适配网络(DAN)

来源:知乎专栏 作者:Lukas Biewald 本文长度为2500字,建议阅读5分钟 本文为你介绍清华大学的龙明盛老师在ICML-15上提出的深度适配网络。 ...

6579
来自专栏AI科技评论

终于盼来了Hinton的Capsule新论文,它能开启深度神经网络的新时代吗?

AI 科技评论按:眼见“深度学习教父”Geoffrey Hinton在许多场合谈到过自己正在攻关的“Capsule”之后,现在我们终于等到了这篇论文,得以具体感...

29610

扫码关注云+社区

领取腾讯云代金券