深度学习元老Yann Lecun详解卷积神经网络(30页干货PPT)

雷锋网注:卷积神经网络(Convolutional Neural Network)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。

Yann LeCun出生在法国,曾在多伦多大学跟随深度学习鼻祖Geoffrey Hinton进行博士后研究。早在20世纪80年代末,Yann LeCun就作为贝尔实验室的研究员提出了卷积网络技术,并展示如何使用它来大幅度提高手写识别能力。上世纪末本世纪初,当神经网络失宠时Yann LeCun是少数几名一直坚持的科学家之一。他于2003年成为纽约大学教授,并从此引领了深度学习的发展,目前任职于Facebook FAIR实验室。本文是Yann LeCun对于卷积神经网络(Convolutional Neural Network)的演讲介绍PPT。

Yann LeCun (信息学与计算机科学)(2015-2016)

ConvNets尝试过程

首个卷积神经网络模型(多伦多大学)(LeCun 88,89)

共320个运用反向传播算法训练的实例

带有步幅的卷积(子样本) 紧密相连的池化过程

在贝尔实验室建立的首个“真实”卷积神经网络模型(LeCun et al 89)

运用反向传播算法进行训练 USPS 编码数字:7300次训练,2000次测试 带有步幅的卷积 紧密相连的池化过程

卷积神经网络(vintage 1990)

滤波-双曲正切——池化——滤波-双曲正切——池化

多重卷积网络

架构

卷积神经网络的结构

卷积神经网络的卷积运算过程大致如下:

输入图像通过三个可训练的滤波器组进行非线性卷积,卷积后在每一层产生特征映射图,然后特征映射图中每组的四个像素在进行求和、加权值、加偏置,在此过程中这些像素在池化层被池化,最终得到输出值。

卷积神经网络的整体结构:

归一化——滤波器组——非线性计算——池化

  • 归一化:图像白化处理的变形(可选择性)

减法运算:平均去除,高通滤波器进行滤波处理 除法运算:局部对比规范化,方差归一化

  • 滤波器组:维度拓展,映射
  • 非线性:稀疏化,饱和,侧抑制

精馏,成分明智收缩,双曲正切等

  • 池化: 空间或特征类型的聚合

最大化,Lp范数,对数概率

LeNet5

卷积神经网络简化模型 MNIST (LeCun 1998)

阶段1:滤波器组——挤压——最大池化

阶段2:滤波器组——挤压——最大池化

阶段3:标准2层 MLP

多特征识别(Matan et al 1992)

每一层都是一个卷积层

单一特征识别器 ——SDNN

滑动窗口卷积神经网络+加权有限状态机

应用

卷积神经网络的应用范围

  • 信号以(多维度)数组的形式出现
  • 具有很强局部关联性的信号
  • 特征能够在任何位置出现的信号
  • 目标物不因翻译或扭曲而变化的信号
  • 一维卷积神经网络:时序信号,文本

文本分类 音乐体裁分类 用于语音识别的声学模型 时间序列预测

  • 二维卷积神经网络:图像,时间-频率表征(语音与音频)

物体检测,定位,识别

  • 三维卷积神经网络:视频,立体图像,层析成像

视频识别/理解 生物医学图像分析 高光谱图像分析

人脸检测(Vaillant et al.93, 94)

  • 应用于大图像检测的卷积神经网络
  • 多尺度热量图
  • 对候选图像的非最大抑制
  • 对256X256图像进行6秒稀疏

人脸检测的艺术结果状态

卷积神经网络在生物图像切割方面的应用

  • 生物图像切割(Ning et al. IEEE-TIP 2005)
  • 运用卷积神经网络在大背景下进行像素标记
  • 卷积神经网络拥有一个像素窗口,标记中央像素
  • 运用一个有条件的随机域进行清除
  • 3D版连接体(Jain et al.2007)

场景解析/标记

场景解析/标记:多尺度卷积神经网络结构

  • 每一个输出值对应一个大的输入背景

46X46全像素窗口;92X92 1/2像素窗口;182X182 1/4像素窗口 [7X7卷积运算]->[2X2池化] ->[7X7卷积运算] ->[2X2池化] ->[7X7卷积运算] -> 监督式训练全标记图像

方法:通过超级像素区域选出主要部分

输入图像——超像素边界参数——超像素边界——通过超像素进行主要部分投票处理——类别与区域边界对齐 多尺度卷积网络——卷积网络特征(每个像素中d=768)卷积分类——“soft”分类得分

场景分析/标记

  • 无前期处理
  • 逐帧进行
  • 在Vittex-6 FPGA硬件上以50ms一帧运行卷积网络

但是在以太网上传输特征限制了系统的表现

针对远程自适应机器人视觉的卷积网络(DARPA LAGR项目2005-2008)

输入图像 标记 分类输出

非常深的卷积网络架构

小内核,较少二次抽样(小部分二次抽样)

VGG GoogleNet Resnet

使用卷积网络进行对象检测和定位

分类+定位:多重移动窗口

  • 将带多重滑动窗口的卷积网络应用到图像上
  • 重要提示:将卷积网络应用到一张图片上非常便宜

只要计算整个图像的卷积并把全连接层复制

分类+定位:滑动窗口+限定框回归

  • 将带多重滑动窗口的卷积网络应用到图像上
  • 对每个窗口,预测一个类别和限定框参数

即便目标不是完全包含在浏览窗口中,卷积网络也能猜测它认为这个目标是什么。

Deep Face

  • Taigman等 CVPR 2014

队列 卷积网络 度量学习

  • Facebook开发的自动标记方法

每天8亿张图片

使用卷积网络进行姿势预估和属性恢复

深度属性模型的姿势对齐网络

Zhang等 CVPR 2014 (Facebook AI Research)

人物检测和姿势预估

Tompson,Goroshin,Jain,Lecun,Bregler等 arxiv(2014)

监督卷积网络画图

  • 使用卷积网络来画图
  • Dosovitskyi等 arxiv (1411:5928)

监督卷积网络画图

  • 生成椅子
  • 特征空间对椅子进行计算

全局(端对端)学习:能量模型

输入——卷积网络(或其他深度架构)——能量模块(潜在变量、输出)——能量

  • 使得系统中每个模块都能进行训练。
  • 所有模块都是同时训练的,这样就能优化全局的损失函数。
  • 包括特征提取器,识别器,以及前后处理程序(图像模型)。
  • 问题:反向传播在图像模型中倾斜

深度卷积网络(还有其他深度神经网络)

  • 训练样本:(Xi,Yi)k=1 到 k
  • 对象函数(边缘型损失= ReLU)

题图来自newscientist.com

via Yann Lecun

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-08-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

ICLR 2019 | 用浅度学习训练深度网络:避开端到端深度学习难题

论文地址:https://openreview.net/pdf?id=r1Gsk3R9Fm

1097
来自专栏机器之心

卷积神经网络「失陷」,CoordConv来填坑

Uber 利用卷积神经网络解决许多方面的问题,其中就包括坐标变换。从自动驾驶汽车的设计到路标的自动检测、再到地图的绘制,Uber 都需要使用卷积网络完成坐标变换...

1113
来自专栏机器之心

学界 | 普适注意力:用于机器翻译的2D卷积神经网络,显著优于编码器-解码器架构

深度神经网络对自然语言处理技术造成了深远的影响,尤其是机器翻译(Blunsom, 2013; Sutskever et al., 2014; Cho et al...

702
来自专栏企鹅号快讯

基于深度学习的行人重识别研究综述

AI 科技评论按:本文为浙江大学罗浩为 AI 科技评论撰写的独家稿件,得到了作者本人指点和审核,在此表示感谢。 前言:行人重识别(Person Re-ident...

4018
来自专栏SIGAI学习与实践平台

理解过拟合

小明是个机器学习爱好者,他很喜欢吃蛋糕。有一天他突然想到:能不能用蛋糕的直径来预测蛋糕的价格。于是他定了各种不同尺寸的蛋糕,然后把尺寸和价格的数据记录起来,接着...

1366
来自专栏Pytorch实践

大话文本分类

概述 文本分类是自然语言处理的重要应用,也可以说是最基础的应用。常见的文本分类应用有:新闻文本分类、信息检索、情感分析、意图判断等。本文主要针对文本分类的方法进...

49210
来自专栏新智元

【实战】GAN网络图像翻译机:图像复原、模糊变清晰、素描变彩图

【新智元导读】本文介绍深度学习方法在图像翻译领域的应用,通过实现一个编码解码“图像翻译机”进行图像的清晰化处理,展示深度学习应用在图像翻译领域的效果。 近年来深...

4863
来自专栏机器之心

学界 | 六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步

作者:Qiantong Xu、Gao Huang、Yang Yuan、Chuan Guo、Yu Sun、Felix Wu、Kilian Weinberger

893
来自专栏新智元

【直观梳理深度学习关键概念】优化算法、调参基本思路、正则化方式等

作者:张皓 【新智元导读】深度学习论文众多,而理解的前提是对基础概念的掌握。本文旨在直观系统地梳理深度学习各领域常见概念与基本思想,使读者对深度学习的重要概念...

36413
来自专栏机器之心

戳穿泡沫:对「信息瓶颈」理论的批判性分析

3498

扫码关注云+社区