深度学习基础学习 | 为什么要进行特征提取
为什么要进行特征提取?
在计算机中,图片以有序的多维矩阵进行存储,按颜色分为灰度图片用二维数组存储图片的像素值,和彩色图片用三维数组存储图片的三个通道颜色的像素值。
以图片大小为64×128×3为例,即计算机中使用24576个数字来存储一张图片,若图像数目较少,可以利用图片矩阵作为图像特征进行一系列操作,但实际应用场景中数据量都非常庞大,若直接以图片的存储矩阵作为图像特征进行各类运算,则将占用大量的存储和计算资源,是非常浪费且不合理的。
然而,根据人们的经验,例如人们可以根据一个人的头部便可判断这个人是谁,而不一定需要整个人的图片,同理,这样巨大的数据中存储的信息对计算机而言也不全部都是必要的,存在一定的冗余信息,可以通过一定的降维方法,对图片数据进行降维,或者称为从图片中提取特征,存储图片的重要信息,利用特征对图片进行更多的操作。
图片的特征提取是深度学习中最为基础也是最为重要的研究问题,特征提取可以简单的看作一个数据降维过程,特征提取过程即是将图片数据转化为具有一定区分度的一定维度的向量的图片特征的过程。
利用图像特征进行图片运算,明显降低了存储和计算复杂度。但是,这里也引出了一个问题,即如何提取有辨别度的图片特征。
在计算机视觉领域中,图片特征可以手工特征和深度学习特征进行划分。
手工特征:
主要根据特定的目的人们设计特定的算法将图片转化为一定维度的数据进行表示,最著名的有尺度不变特征变换特征(SIFT特征)和有向梯度直方图特征(HOG特征)。SIFT特征根据高斯差分函数计算而来,具有旋转、光照不变性;而HOG特征则经过对图片统计量进行处理而得。
深度学习特征:
主要指通过卷积神经网络提取图片特征,常用的有VGG和ResNet分类网络。
领取专属 10元无门槛券
私享最新 技术干货