快速指南：使用OpenCV预处理神经网络中的面部图像的

小白学视觉

发布于 2020-07-28 14:57:07

1K0

发布于 2020-07-28 14:57:07

文章被收录于专栏：深度学习和计算机视觉

本期将介绍脸部检测、眼睛检测；图像拉直、裁剪、调整大小、归一化等内容

目前，涉及面部分类的计算机视觉问题，通常都需要使用深度学习。因此在将图像输入神经网络之前，需要经过一个预处理阶段，以便达到更好的分类效果。

图像预处理通常来说非常简单，只需执行几个简单的步骤即可轻松完成。但为了提高模型的准确性，这也是一项非常重要的任务。对于这些问题，我们可以使用OpenCV完成：一个针对（实时）计算机视觉应用程序的高度优化的开源库，包括C ++，Java和Python语言。

接下来我们将一起探索可能会应用在每个面部分类或识别问题上应用的基本原理，示例和代码。

注意：下面使用的所有图像均来自memes.。

图片载入

我们使用该imread()函数加载图像，并指定文件路径和图像模式。第二个参数对于运行基本通道和深度转换很重要。

img = cv2.imread('path/image.jpg', cv2.IMREAD_COLOR)

要查看图像可以使用imshow()功能：

cv2.imshow(img)

如果使用的type(img)话，将显示该图像的尺寸包括高度、重量、通道数。

彩色图像有3个通道：蓝色，绿色和红色（在OpenCV中按此顺序）。

我们可以很轻松查看单个通道：

# Example for green channel img[:, :, 0]; img[:, :, 2]; cv2.imshow(img)

Grayscale version

灰度图像

为了避免在人脸图像分类过程中存在的干扰，通常选择黑白图像（当然也可以使用彩图！请小伙伴们自行尝试两者并比较结果）。要获得灰度图像，我们只需要在图像加载函数中通过将适当的值作为第二个参数传递来指定它：

img = cv2.imread('path/image.jpg', cv2.IMREAD_GRAYSCALE)

现在，我们的图像只有一个灰度通道了！

面部和眼睛检测

在处理人脸分类问题时，我们可能需要先对图形进行裁剪和拉直，再进行人脸检测以验证是否有人脸的存在。为此，我们将使用OpenCV中自带的的基于Haar特征的级联分类器进行对象检测。

首先，我们选择用于面部和眼睛检测的预训练分类器。以下时可用的XML文件列表：

1）对于面部检测，OpenCV提供了这些（从最松的先验到最严格的先验）：

• haarcascade_frontalface_default.xml

• haarcascade_frontalface_alt.xml

• haarcascade_frontalface_alt2.xml

• haarcascade_frontalface_alt_tree.xml

2）对于眼睛检测，我们可以选择以下两种：

• haarcascade_eye.xml

• haarcascade_eye_tree_eyeglasses.xml（正在尝试处理眼镜！）

我们以这种方式加载预训练的分类器：

face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + ‘haarcascade_frontalface_default.xml’)eyes_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + ‘haarcascade_eye.xml’)

我们可以测试几种组合，但我们要记住一点，没有一种分类器在所有情况下都是最好的（如果第一个分类失败，您可以尝试第二个分类，甚至尝试所有分类）。

对于人脸检测，我们可使用以下代码：

faces_detected = face_cascade.detectMultiScale(img, scaleFactor=1.1, minNeighbors=5)

结果是一个数组，其中包含所有检测到的脸部特征的矩形位置。我们可以很容易地绘制它：

(x, y, w, h) = faces_detected[0] cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 1); cv2.imshow(img)

对于眼睛，我们以类似的方式进行，但将搜索范围缩小到刚刚提取出来的面部矩形框内：

eyes = eyes_cascade.detectMultiScale(img[y:y+h, x:x+w])for (ex, ey, ew, eh) in eyes: cv2.rectangle(img, (x+ex, y+ey), (x+ex+ew, y+ey+eh), (255, 255, 255), 1)