专栏首页AI研习社OpenCV-Python速查:从载入图片到人脸识别

OpenCV-Python速查:从载入图片到人脸识别

本文为 AI 研习社编译的技术博客,原标题 : OpenCV-Python Cheat Sheet: From Importing Images to Face Detection 作者 | Salma Ghoneim 翻译 | linlh、肯恩•阿瑟 编辑 | 王立鱼 原文链接: https://heartbeat.fritz.ai/opencv-python-cheat-sheet-from-importing-images-to-face-detection-52919da36433 注:本文的相关链接请访问文末【阅读原文】

什么是OpenCV-Python?

OpenCV是一个计算机视觉和机器学习的开源库。拥有2500+个优化算法——一套非常全面的既经典又最先进的计算机视觉和机器学习算法的集合,具备很多接口,包括Python,Java,C++和Matlab。

这次,让我们来攻克Python的接口:

目录:

  • 安装方式
  • 导入/查看图像
  • 裁剪:Cropping
  • 调整:Resizing
  • 旋转:Rotating
  • 灰度和阈值:Grayscaling and Thresholding
  • 模糊/平滑:Blurring/Smoothing
  • 绘制矩形/边界框
  • 画线
  • 在图片上写入文字
  • 人脸识别
  • 轮廓(Contours)——一种物体检测的方法
  • 保存图像

安装方式有两种:Window用户,Linux用户;不管是使用哪种方式都请阅读原文查看。

导入图像 & 显示

import cv2
image = cv2.imread("./Path/To/Image.extension")
cv2.imshow("Image", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

提醒1:通过OpenCV的种方式读取图像,它不是RGB色域的——而是BGR色域的。有时候这不会是一个问题,只有在你想加入彩色内容到你的图像中的时候会有麻烦。

有两个解决办法:

  1. 将R - 1st(红色)与B - 3rd(蓝色)切换,使红色为(0,0,255)而不是(255,0,0)。
  2. 改变色域为RGB
rgb_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

然后在你的rgb_image上继续编写代码,而不是在image上。

提醒2:按下任意按键,来关闭显示图像的窗口。如果你使用关闭按钮可以能会导致卡主(在我使用Jupyter Notebook时,有发生这样的情况)

简单起见,整个教程中我会使用下面的方法来显示图像:

import cv2
def viewImage(image, name_of_window):
    cv2.namedWindow(name_of_window, cv2.WINDOW_NORMAL)
    cv2.imshow(name_of_window, image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

图片来源: Pixabay

裁剪:Cropping

图片来源: Pixabay

裁剪后的狗狗

import cv2
cropped = image[10:500, 500:2000]
viewImage(cropped, "Doggo after cropping.")

在图像:image[10:500, 500:2000] 中以(y, x)为起点,裁剪大小为(h, w)的图像: image[y:y+h, x:x+w]

调整大小:Resizing

图像来源: Pexels

调整20%之后

import cv2
scale_percent = 20 # percent of original size
width = int(img.shape[1] * scale_percent / 100)
height = int(img.shape[0] * scale_percent / 100)
dim = (width, height)

resized = cv2.resize(img, dim, interpolation = cv2.INTER_AREA)

viewImage(resized, "After resizing with 20%")

调整大小的函数保持了和原来图像一样的尺寸比。

更多关于图像缩放的函数,查看原文。

旋转:Rotating

上方: 照片来自Pexels的Jonathan Meyer.下方:旋转180度后的狗狗

import cv2
(h, w, d) = image.shape
center = (w // 2, h // 2)
M = cv2.getRotationMatrix2D(center, 180, 1.0)
rotated = cv2.warpAffine(image, M, (w, h))
viewImage(rotated, "Doggo after rotation by 190 degrees")

image.shape输出了图像的高度,宽度和通道数。M是旋转矩阵——根据图像中心旋转180度。-ve按照顺指针方向旋转图像 & +ve 则是按照逆时针方向旋转。

灰度和阈值(黑&白效果)

图像来源: Pexels

import cv2
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
ret, threshold_image = cv2.threshold(im, 127, 255, 0)
viewImage(gray_image, "Gray-scale doggo")
viewImage(threshold_image, "Black & White doggo")

gray_image是图像的灰度单通道版本。阈值函数将所有阴影变为比127更暗(更小)到0并且所有更亮(更大)到255。

另外一个例子:

ret, threshold = cv2.threshold(im, 150, 200, 10)

这将使所有阴影小于150到10并且全部大于200。

更多关于阈值函数,查阅原文。

上方: 灰度图像狗狗 下方: 黑白狗狗

模糊/平滑

上方: 图像来自Pixabay. 下方: 模糊的狗狗

import cv2
blurred = cv2.GaussianBlur(image, (51, 51), 0)
viewImage(blurred, "Blurred doggo")

GussianBlur函数接收3个参数:

  • 第一个参数是你想要模糊的图像
  • 第二个参数必须是两个正奇数的元组。当他们增加时,模糊效果会增加。
  • 第三个参数是sigmaX和sigmaY。当保留为0时,他们将根据内核大小自动计算

更多的模糊函数,参看原文。

在图像上绘制矩形/边界框

上方: 图像来自Pexels. 下方: 狗狗脸上画了一个矩形框

import cv2
output = image.copy()
cv2.rectangle(output, (2600, 800), (4100, 2400), (0, 255, 255), 10)
viewImage(output, "Doggo with a rectangle on his face")

矩形框函数接收5个参数:

  • 第一个参数是图像
  • 第二个参数是x1, y1 ——对应左上角
  • 第三个参数是x2, y2 ——对应右下角
  • 第四个参数是矩形颜色(GBR/RGB,具体取决于你导入图像的方式)
  • 第五个参数矩形线条的粗细

在图片上绘制线段

上方: 图像来自Pexels. 下方: 2只狗狗被一条直线分隔

import cv2
output = image.copy()
cv2.line(output, (60, 20), (400, 200), (0, 0, 255), 5)
viewImage(output, "2 Doggos separated by a line")

line函数需要传入5个参数:

  • 第一个参数是你需要在上面绘制线段的图像。
  • 第二个参数是直线的x1, y1坐标。
  • 第三个参数是直线的x2 y2坐标。
  • 第四个参数是线段的颜色(可以是GBR/也可以是RGB,这取决于你导入的图片的格式)。
  • 第五个参数是线段的粗细。

在图片上输入文字

上方: 图像来自Pexels. 下方: 含有文字的图片

import cv2
output = image.copy()
cv2.putText(output, "We <3 Dogs", (1500, 3600),cv2.FONT_HERSHEY_SIMPLEX, 15, (30, 105, 210), 40) 
viewImage(output, "image with text")

putText 函数包含七个参数:

  • 第一个参数是您需要在上面输入文字的图片
  • 第二个参数是需要输入的文字内容
  • 第三个参数是文字开始区域的左下角的x,y坐标
  • 第四个参数是字体
  • 第五个参数是字体大小
  • 第六个参数是字体颜色(可以是GBR/也可以是RGB,这取决于你导入的图片的格式)。
  • 第七个参数是字体的粗细

人脸识别

非常抱歉,此处我们不能放狗狗的图片了。:(

来自于 Pixabay的免费图片

import cv2

image_path = "./Path/To/Photo.extension"
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

image = cv2.imread(image_path)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(
    gray,
    scaleFactor= 1.1,
    minNeighbors= 5,
    minSize=(10, 10)
)

faces_detected = format(len(faces)) + " faces detected!"
print(faces_detected)# Draw a rectangle around the faces
for (x, y, w, h) in faces:
    cv2.rectangle(image, (x, y), (x+w, y+h), (255, 255, 0), 2)
    
viewImage(image,faces_detected)

detectMultiScale函数是一个检测物体的通用函数。当我们把它用于人脸检测时,它就会从图像中检测出人脸。

detectMultiScale函数 包含四个参数 :

  • 第一个参数是灰度图
  • 第二个参数是缩放比例。因为在我们的图片中,有些人脸由于更靠近照相机,导致他们看起来比后面的人脸更大些。缩放参数就是为了解决这种问题的。
  • 检测算法使用了滑动窗口来检测目标物体。minNeighbors参数定义了当识别出一个人脸之前在当前物体周围需要检测的物体数目。
  • 同时minSize参数给出了窗口的大小

在图片中检测出两张人脸

轮廓—— 一种物体检测的方法

使用基于颜色的图片分段,我们可以实现物体的检测。cv2.findContours 和 cv2.drawContours 两个函数可以帮我们实现上述目标。

近期,我写了一篇非常详细的文章,文章的题目是使用python来实现基于颜色的图片分段的物体检测。如果你想了解关于轮廓的知识,你可以去阅读这篇文章。

最后,保存图片

import cv2
image = cv2.imread("./Import/path.extension")
cv2.imwrite("./Export/Path.extension", image)

最后总结

想要继续查看该篇文章相关链接和参考文献?

点击底部【阅读原文】即可访问:

https://ai.yanxishe.com/page/TextTranslation/1659

本文分享自微信公众号 - AI研习社(okweiwu),作者:雷锋字幕组

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 手把手教你如何用 OpenCV + Python 实现人脸识别

    下午的时候,配好了 OpenCV 的 Python 环境,OpenCV 的 Python 环境搭建。于是迫不及待的想体验一下 opencv 的人脸识别,如下文。...

    AI研习社
  • 使用 Python 通过基于颜色的图像分割进行物体检测

    如果你已经安装了jupyter notebook或者一个IDE,你可以运行python然后下载OpenCV,只需要跳到执行即可。

    AI研习社
  • 25 行 Python 代码就能实现人脸识别?这篇文章告诉你详情

    首先,在阅读本文之前,需要注意以下几点: 建议先读一遍本文再跑代码——你需要理解这些代码是干什么的。成功跑一遍不是目的,能够举一反三、在新任务上找出 bug 才...

    AI研习社
  • 基于Opencv的抠图

    step2:用Sobel算子计算x,y方向上的梯度,之后在x方向上减去y方向上的梯度,通过这个减法,我们留下具有高水平梯度和低垂直梯度的图像区域。

    于小勇
  • 常见的图像处理技术

    深度学习对于图像的分析、识别以及语义理解具有重要意义。“图像分类”、“对象检测”、“实例分割”等是深度学习在图像中的常见应用。为了能够建立更好的训练数据集,我们...

    小白学视觉
  • 图片人脸检测——OpenCV版(二)

    Java中文社群_老王
  • 图片人脸检测——OpenCV版(二)

    图片人脸检测 人脸检测使用到的技术是OpenCV,上一节已经介绍了OpenCV的环境安装,点击查看. 功能展示 识别一种图上的所有人的脸,并且标出人脸的位置,画...

    Java中文社群_老王
  • opencv︱图片与视频的读入、显示、写出、放缩与基本绘图函数介绍

    opencv中读入、显示、写出图片:cv2.imread(), cv2.imshow(), cv2.imwrite()

    素质
  • Python-OpenCV(1)

    前面的几个博客写的乱七八糟的,一来是初学数字图像,二是之前没有写过博客,所以对不起之前看我博客的各位啦!!!!!! 现在决定使用python重新写这个系列,不再...

    GavinZhou
  • 爬虫计算两张验证图片的距离(情况一)

    小小咸鱼YwY

扫码关注云+社区

领取腾讯云代金券