OpenCV检测篇(一):猫脸检测

OpenCV

OpenCV是时下最流行的基于C++的开源计算机视觉库,它功能丰富,函数众多,从最基本的读写图片,到简单的图像处理(比如降噪滤波、边缘检测、图像变换、特征提取等),再到更加高级的行人检测、人脸识别、文本识别等,尽皆包含。在OpenCV提供的函数的基础上,我们可以很方便地开发自己的应用,实现自己的算法。总的来说,就是OpenCV非常强大。具体有多强大?那得用了才知道。

很多要做人脸识别,要用到SIFT特征的人都问过的一个问题是,为什么配置好opencv之后,却找不到人脸识别的头文件,找不到SIFT在哪?这是因为OpenCV3.0之后,把一些还在最新的,但不是很稳定的,还在测试阶段的东西放在了contrib模块里面。而且官方默认不带contrib模块。不幸的是,我们最想用的人脸识别和SIFT特征都在contrib里面。如果需要用的话,那就需要自己编译了。opencv在Visual Studio上的配置和编译contrib的方法可以参考我之前的博客。今天的内容仍然是用Python语言,最近用Python用着比较顺手。

OpenCV的Python环境配置

显然,跟众多基于C++的库一样, OpenCV也是有Python接口的。Python下配置OpenCV可以用下面两种方法:

  1. 官网下载并安装OpenCV之后,在目录\opencv\build\python\2.7\x64之下有一个cv2.pyd文件,把它拷贝到python安装目录下的\Lib\site-packages文件夹下面即可。需要注意的是版本要对应,比如这里就要对应64位的Python2.7。而且目前官方自带的只有Python2.7版本的包。如果想要其他版本怎么办?
  2. 那就要说到一个神奇的网站了:Unofficial Windows Binaries for Python Extension Packages,这里面包含了几乎所有的能用到的Python库的安装包,比如我们需要的OpenCV,这里可以找到下面这么多版本,可以适应不同的需求,还有编译的contrib版本的,简直是惊喜。

按照自己的环境下载相应的版本,然后还是用pip安装,命令如下:

pip install *.whl

请把星号换成对应的名字。

我这里用的是Python3.6包含contrib的64位的包。

猫脸检测

喵星人真的是要统治世界了。不然为什么OpenCV自带的检测器中除了人脸检测、行人检测这些意料之中就应该存在的检测器之外,还悄悄多出了猫脸检测器呢。

今天我们就来试一下这个猫脸检测到底 是什么样的?基于OpenCV的猫脸检测十分简单。用Python的话只有区区20行代码。其中20行代码中发挥主要作用的只有一个函数:

detectMultiScale()

此函数的作用是,在输入图像中检测不同尺寸的对象,返回包含对象的矩形框。它接收的参数:

1.image——输入图像

2.scaleFactor——表示每轮检测图像齿轮减少的比例

3.minNeighbors——指明对象要至少被检测到几次才能判定对象确实存在

4.minSize——检测对象的最小尺寸

5.maxSize——检测对象的最大尺寸

代码

按照惯例,注释齐全,无需多说。

# -*- coding=utf-8 -*-
import cv2
# 加载猫脸检测器
catPath = "haarcascade_frontalcatface.xml"
faceCascade = cv2.CascadeClassifier(catPath)
# 读取图片并灰度化
img = cv2.imread("cat1.jpg")  
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 猫脸检测
faces = faceCascade.detectMultiScale(
    gray,
    scaleFactor= 1.02,
    minNeighbors=3,
    minSize=(150, 150),
    flags=cv2.CASCADE_SCALE_IMAGE
)
# 框出猫脸并加上文字说明
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 0, 255), 2)
    cv2.putText(img,'Cat',(x,y-7), 3, 1.2, (0, 255, 0), 2, cv2.LINE_AA)
# 显示图片并保存
cv2.imshow('Cat?', img)
cv2.imwrite("cat.jpg",img)
c = cv2.waitKey(0)

效果

运行Python脚本后效果如下:

举一反三

本文虽然只是在说猫脸检测,但是在OpenCV下,人脸检测、行人检测、人眼检测等都是同样的道理,同样的流程。只需要把最开始相应的检测器换掉,然后按照实际情况调节detectMultiScale()的参数即可。比如以下是人脸检测的效果:

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

1 条评论
登录 后参与评论

相关文章

来自专栏何俊林

使用MediaCodec和RTMP做直播推流

目前开源的项目或市面上的Android直播客户端主要是用ffmpeg来实现推流的。本文将介绍使用Android原生的视频编码类MediaCodec实现直播推流。

1305
来自专栏安全领域

在物联网中应用机器学习:使用 Android Things 与 TensorFlow

在本教程中,我们将探索如何使用 Android Things 和 TensorFlow 将机器学习应用到物联网中。

69015
来自专栏Hadoop实操

如何在CDH中使用PySpark分布式运行GridSearch算法

当我们在跑机器学习程序,尤其是调节网格参数时,通常待调节的参数有很多,参数之间的组合更是复杂。Python的sklearn包中GridSearch模块,能够在指...

1433
来自专栏GuZhenYin

脑洞大开之采用HTML5+SignalR2.0(.Net)实现原生Web视频

前言  - -,我又来了,今天废话不多说,我们直接来实现Web视频聊天. 采用的技术如下: HTML5 WebRTC SignalR2.2.0 localRes...

1945
来自专栏磨磨谈

利用火焰图分析ceph pg分布

性能优化大神Brendan Gregg发明了火焰图来定位性能问题,通过图表就可以发现问题出在哪里,通过svg矢量图来查看性能卡在哪个点,哪个操作占用的资源最多 ...

862
来自专栏TensorFlow从0到N

TensorFlow从0到1 - 17 - Step By Step上手TensorBoard

上一篇16 L2正则化对抗“过拟合”提到,为了检测训练过程中发生的过拟合,需要记录每次迭代(甚至每次step)模型在训练集和验证集上的识别精度。其实,为了能更...

3488
来自专栏AI研习社

Facebook 发布 wav2letter 工具包,用于端到端自动语音识别

AI 研习社消息,日前, Facebook 人工智能研究院发布 wav2letter 工具包,它是一个简单高效的端到端自动语音识别(ASR)系统,实现了 Wav...

3655
来自专栏SnailTyan

Check failed: shape[i] >= 0 (-1 vs. 0)错误

在使用Caffe模型进行图像分类时,通常使用的图像大小为224 * 224,如果改变输入图像的大小,有时候会碰到Check failed: shape[i] >...

2240
来自专栏瓜大三哥

直方图操作(一)

如果要对图像分辨率为640x512位宽的图像进行直方图统计,则有 AWDPRAM≥8 DWDPRAM≥log2(Pixelttotal)=log2(640x51...

1918
来自专栏王亚军的专栏

谷歌开源图片压缩算法 Guetzli 实测体验报告

谷歌大神又出开源新技术啦,这次是对JPEG格式的图片采用全新算法重新编码,输出的图片还是JPEG但是图片大小明显缩小,而质量不但没有损失,甚至还更加优化,速速来...

7.2K1

扫码关注云+社区