漫谈卷积神经网络之一(入门漫谈

入门漫谈

这篇文章主要讨论下卷积神经网络,做下入门

我们知道,卷积神经网络是深度学习中非常重要的一种网络架构,在计算机视觉中取得了非常重大的成功,卷积神经网络为什么在图像处理中这么有效,是什么东西赋予了它观察图片的能力呢,我们会说,是样本,是标注样本,是样本告诉它,什么是飞机,什么是鸟,什么是热狗,什么是烤肠。。。(废话)

理解图像

图像是什么,在计算机看来,图像就是像素点构成的矩阵, 如果是黑白图片,那么我们只需要一个矩阵就可以表述,像这样, 左图的矩阵就代表了右边的图片,30表示黑色像素点,0表示没有像素点,如果关注图片的注释的可能会发现这是一个滤波器的表示,但是这并不影响对黑白图像用矩阵表示的说明

人类大脑是一非常强大的机器,每秒内能看(捕捉)多张图,并在意识不到的情况下就完成了对这些图的处理。但机器并非如此。机器处理图像的第一步是理解,理解如何表达一张图像,进而读取图片。

简单来说,每个图像都是一系列特定排序的图点(像素)。如果你改变像素的顺序或颜色,图像也随之改变。举个例子,存储并读取一张上面写着数字 4 的图像。

基本上,机器会把图像打碎成像素矩阵,存储每个表示位置像素的颜色码。在下图的表示中,数值 1 是白色,256 是最深的绿色(为了简化,我们示例限制到了一种颜色)。

一旦你以这种格式存储完图像信息,下一步就是让神经网络理解这种排序与模式。

卷积神经网络导入

就来具体说下卷积神经网络,卷积神经网络也许是生物学启发人工智能的最为成功的案例,虽然卷积神经网络也有经过一些其他领域的指导,但是神经网络的一些关键设计,原则来自于神经科学,两个非常牛逼的神经生物学家,他们有一个伟大的发现: 猫的(浅层)视觉神经元对于某些特定的光的模式(例如精确定向的条纹)会反应非常强烈,对其他模式几乎完全没有什么反应,这说明了一个问题: 假如一个在自拍的猫咪,它的某些视觉神经元会对它圆圆的眼睛反应比较大, 某些神经元会对它的脸部的条纹反应比较大,然后信息逐渐向深层神经元传递(此表述可能不准确),信息会逐渐抽象,比如,从轮廓,条纹,抽象到大眼睛,美丽的花纹,到最后是:哇,一只帅喵!

下图表明,前面的层提取的特征比较简单,是一些颜色、边缘特征。越往后的卷积层提取的特征越复杂,是一些复杂的几何形状。这符合我们对卷积神经网络的设计初衷,即通过多层卷积完成对图像的逐层特征提取和抽象。

下面继续以汽车为例,这是一辆 特斯拉 model 3, 通过我们的卷积神经网络,可以发现,经过每一层

提取的特征越来越抽象,我们知道,假如计算机要对这个图片进行分类,有10个候选类别,计算机会计算一个分类为每一个类别的概率,然后分类为概率最大的一个类别,我们看到,第一层的时候,大概可以知道轮廓和边缘,当然,这无法作为分类的依据,越往后,提取的特征越抽象,到后面,只是一些复杂的几何图像,完全看不懂是什么鬼,我们看不懂是什么鬼,很正常,计算机知道是什么鬼,因为这是它能理解的特征,用上面的人识别车做个类比,后面一些不知道什么鬼的几何图像,对于计算机来说,可能就是车轮,进气格栅,车厢等等,最后,将这些特征继续组合起来,归一化为概率,然后就可以识别出具体是哪个类别了

卷积是一种数学运算,数学中有种运算方式称之为卷积运算,我们可以认为是特征提取的一种方式,卷积神经网络这里,会有多个滤波器,每个滤波器代表一组特定的神经元,比如识别一些条纹,一些圈圈的特征,这些滤波器就是在和我们的图像进行卷积运算,就可以对图像特征进行逐层抽取,组合,抽象,最后得到分类的概率,具体涉及到的细节,我将在后面的文章中具体详谈

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180615G0NLKT00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券