漫谈卷积神经网络之一（入门漫谈

文章来源：企鹅号 - 小猿爱算法

入门漫谈

这篇文章主要讨论下卷积神经网络，做下入门

我们知道，卷积神经网络是深度学习中非常重要的一种网络架构，在计算机视觉中取得了非常重大的成功，卷积神经网络为什么在图像处理中这么有效，是什么东西赋予了它观察图片的能力呢，我们会说，是样本，是标注样本，是样本告诉它，什么是飞机，什么是鸟，什么是热狗，什么是烤肠。。。（废话）

理解图像

图像是什么，在计算机看来，图像就是像素点构成的矩阵，如果是黑白图片，那么我们只需要一个矩阵就可以表述，像这样，左图的矩阵就代表了右边的图片，30表示黑色像素点，0表示没有像素点，如果关注图片的注释的可能会发现这是一个滤波器的表示，但是这并不影响对黑白图像用矩阵表示的说明

人类大脑是一非常强大的机器，每秒内能看（捕捉）多张图，并在意识不到的情况下就完成了对这些图的处理。但机器并非如此。机器处理图像的第一步是理解，理解如何表达一张图像，进而读取图片。

简单来说，每个图像都是一系列特定排序的图点（像素）。如果你改变像素的顺序或颜色，图像也随之改变。举个例子，存储并读取一张上面写着数字 4 的图像。

基本上，机器会把图像打碎成像素矩阵，存储每个表示位置像素的颜色码。在下图的表示中，数值 1 是白色，256 是最深的绿色（为了简化，我们示例限制到了一种颜色）。

一旦你以这种格式存储完图像信息，下一步就是让神经网络理解这种排序与模式。

卷积神经网络导入

就来具体说下卷积神经网络，卷积神经网络也许是生物学启发人工智能的最为成功的案例，虽然卷积神经网络也有经过一些其他领域的指导，但是神经网络的一些关键设计，原则来自于神经科学，两个非常牛逼的神经生物学家，他们有一个伟大的发现：猫的（浅层）视觉神经元对于某些特定的光的模式（例如精确定向的条纹）会反应非常强烈，对其他模式几乎完全没有什么反应，这说明了一个问题：假如一个在自拍的猫咪，它的某些视觉神经元会对它圆圆的眼睛反应比较大，某些神经元会对它的脸部的条纹反应比较大，然后信息逐渐向深层神经元传递（此表述可能不准确），信息会逐渐抽象，比如，从轮廓，条纹，抽象到大眼睛，美丽的花纹，到最后是：哇，一只帅喵！

下图表明，前面的层提取的特征比较简单，是一些颜色、边缘特征。越往后的卷积层提取的特征越复杂，是一些复杂的几何形状。这符合我们对卷积神经网络的设计初衷，即通过多层卷积完成对图像的逐层特征提取和抽象。

下面继续以汽车为例，这是一辆特斯拉 model 3，通过我们的卷积神经网络，可以发现，经过每一层

提取的特征越来越抽象，我们知道，假如计算机要对这个图片进行分类，有10个候选类别，计算机会计算一个分类为每一个类别的概率，然后分类为概率最大的一个类别，我们看到，第一层的时候，大概可以知道轮廓和边缘，当然，这无法作为分类的依据，越往后，提取的特征越抽象，到后面，只是一些复杂的几何图像，完全看不懂是什么鬼，我们看不懂是什么鬼，很正常，计算机知道是什么鬼，因为这是它能理解的特征，用上面的人识别车做个类比，后面一些不知道什么鬼的几何图像，对于计算机来说，可能就是车轮，进气格栅，车厢等等，最后，将这些特征继续组合起来，归一化为概率，然后就可以识别出具体是哪个类别了

卷积是一种数学运算，数学中有种运算方式称之为卷积运算，我们可以认为是特征提取的一种方式，卷积神经网络这里，会有多个滤波器，每个滤波器代表一组特定的神经元，比如识别一些条纹，一些圈圈的特征，这些滤波器就是在和我们的图像进行卷积运算，就可以对图像特征进行逐层抽取，组合，抽象，最后得到分类的概率，具体涉及到的细节，我将在后面的文章中具体详谈

发表于: 2018-06-152018-06-15 11:51:42
原文链接：https://kuaibao.qq.com/s/20180615G0NLKT00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

漫谈卷积神经网络之一（入门漫谈

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐