一篇文章“简单”认识《卷积神经网络》

原创

一颗小树x

修改于 2021-05-13 15:29:02

6.6K0

修改于 2021-05-13 15:29:02

文章被收录于专栏：用户5033944的专栏

一、概念了解

前言

卷积神经网络（Convolutional Neural Network, CNN），对于图像处理有出色表现，在计算机视觉中得到了广泛的应用。

卷积神经网络通过卷积层与池化层的叠加实现对输入数据的特征提取，最后连接全连接层实现分类。

基于什么提出卷积神经网络？

动物视觉系统对外界的感知是：

视觉皮层的每个神经元只响应某些特定区域的刺激（感受野）
从局部到全局（信息分层处理机制）

卷积神经网络：

每个神经元只需对局部图像进行感知；

在更高层将局部的信息综合起来，得到全局信息；

卷积（Convolution）

每一个卷积核，相对于一个滤波器；它会筛选合适的信息，过滤不匹配的信息；卷积层能提取特征，比如：提取一幅图像的特征。

比如，卷积核a，它是用来提取出图片的形状信息；卷积核b，它是用来提取出图片的颜色信息；

池化（Pooling）

池化操作是降采样（Subsampling）中的一种；为了描述大的图像，可以对不同位置的特征进行聚合统计；

通常卷积层后面接着一个池化层，池化层能对卷积层提取到特征，进行降低特征图参数量，同时保留图像显著特征；池化层还能降低过拟合、扩大感知野和解决图像不变性。

池化一般分为最大池化和平均池化；采用图像区域上某个特征的平均值或最大值，维度低且有效（不容易过拟合）。

全连接层

全连接层可以用来将最后得到的特征（卷积层与池化层提取到的特征），映射到线性可分的空间，在整个卷积神经网络中起到“分类器”的作用。

优势

卷积神经网络十分合适用于大尺寸图像的学习；

训练参数少（卷积操作、权值共享、池化操作减少了训练的参数）
平移不变性（图像被平移，卷积依然保证能检测到它的特征）
模式具有空间层次（当浅层的神经元学习到较小的局部模式后，后面的卷积层会将前一层学习到的模式组合成更高的模式）

二、进一步理解

前言

卷积神经网络（Convolutional Neural Network, CNN），是一种前馈神经网络，对于图像处理有出色表现，在计算机视觉中得到了广泛的应用。

卷积神经网络主要包括卷积层（convolution layer）、池化层（pooling layer）和全连接层（fully connected layer）。

卷积神经网络通过卷积层与池化层的叠加实现对输入数据的特征提取，最后连接全连接层实现分类。

卷积神经网络通过卷积操作和池化操作学习输入特征的局部模式；随着网络层数的增加，卷积神经网络对这些局部模式不断地进行组合、抽象，最终学习到高级特征。

卷积神经网络能提取图像的特征，避免了对图像的复杂前期预处理，而可以直接输入图像原始图像。即：卷积层+池化层用来提取特征；全连接层用来分类等。

基于什么提出卷积神经网络？

动物视觉系统对外界的感知是：

视觉皮层的每个神经元只响应某些特定区域的刺激（感受野）
从局部到全局（信息分层处理机制）

一般认为人对外界的认知是从局部到全局，图像像素点的空间联系也是局部的像素联系较为紧密，而距离较远的像素相关性则较弱。

卷积神经网络：

每个神经元只需对局部图像进行感知；

在更高层将局部的信息综合起来，得到全局信息；

卷积（Convolution）

简介

卷积滤波，每一个卷积核，相对于一个滤波器；它会筛选合适的信息，过滤不匹配的信息。

比如，卷积核a，它是用来提取出图片的形状信息；卷积核b，它是用来提取出图片的颜色信息；

一个卷积核提取到的特征对应一个通道（上图：二维矩阵），不同卷积核得到的特征进行堆叠，形成具有多个不同通道的特征立方体。

卷积操作

几个重要的参数

卷积和尺寸：感受野的大小，通常指卷积核的长和宽；比如：3*3，5*5的卷积核
卷积核步长：卷积核在长度方向核宽度方向上每次一点的距离。比如：步长为1，每次移动一格；步长为3，每次移动三格；
卷积核数量：卷积核的数量对应卷积核输出特征的深度，每个卷积核的输出为一个通道，多个卷积核的输出进行堆叠，形成一个特征立方体。比如：一共有4个不同的卷积核，那么形成4个平面组成的立方体。

图像化

卷积和尺寸：感受野的大小，通常指卷积核的长和宽；比如：3*3，5*5的卷积核