级联人脸检测--A Convolutional Neural Network Cascade for Face Detection

A Convolutional Neural Network Cascade for Face Detection CVPR2015

https://github.com/anson0910/CNN_face_detection https://github.com/mks0601/A-Convolutional-Neural-Network-Cascade-for-Face-Detection https://github.com/IggyShone/fast_face_detector

本文早期使用级联CNN网络进行人脸检测代表性文献,在速度和精度上效果和以前算法相比都有所提升。 缺点:各个CNN trained sequentially, 不是 end-to-end, which may not be desirable

最早最经典的级联人脸检测算法是 Viola-Jones face detector,使用了 Haar feature,这个检测器对于正面的人脸效果还是不错的。但是对于实际应用环境中人脸姿态的变化,人脸表情的多样性,光照的多样性,使其检测性能降低很多。 究其原因主要还是 Haar feature 过于简单了。

后来很多学者就对 Viola-Jones face detector 提出改进,使用更先进的特征,虽然先进特征的计算量增加了,但是相应级联的层数也减少了,所以总体上计算量可能减少了,精度提高了。所以我们认为将更先进的特征应用于人脸检测效果应该更好。考虑到CNN特征的计算量很大,所以我们使用级联CNN来进行人脸检测。

3.1. Overall framework 我们的思路大致如下:首先使用一个小型网络 12-net 对图像进行全局搜索人脸候选区域,检测区域是 12×12图像块,搜索步长是4个像素,可以快速排除90%的非人脸区域,使用非极大值抑制排除一些重叠区域,再对剩下的候选区域使用一个小网络 12-calibration-net 进行人脸矩形框微调,包括位置和尺度。微调后再使用一个中型网络 24-net 对微调后的人脸候选区进行二分类,检测区域是 24×24 图像块,再排除90%的非人脸区域,再对剩下的候选区域使用一个中型网络 24-calibration-net 进行人脸矩形框微调,包括位置和尺度,使用非极大值抑制排除一些重叠区域,微调后再使用一个大型网络 48-net 对微调后的人脸候选区进行二分类,检测区域是 48×48 图像块,非极大值抑制,最后用 48-calibration-net 进行人脸矩形框微调 输出结果。

检测示意图:

3.2. CNN structure

三个人脸二分类CNN网络结构

三个人脸矩形框矫正CNN网络结构

矫正效果示意图:

有无多尺度检测对比

AFW dataset

FDDB

The proposed detector is very fast, achieving 14 FPS for typical VGA images on CPU and can be accelerated to 100 FPS on GPU

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

ECCV 2018 | 建模任务相关注视点转移,实现第一人称视频注视点的准确估计

作者:Yifei Huang(黄逸飞)、Minjie Cai(蔡敏捷)、Zhenqiang Li(李振强)、Yoichi Sato(佐藤洋一)

651
来自专栏机器之心

学界 | 世界权威评测冠军:百度人脸检测算法PyramidBox

选自arXiv 机器之心编译 近日,百度凭借全新的人脸检测深度学习算法 PyramidBox,在世界最权威的人脸检测公开评测集 WIDER FACE 的「Eas...

3475
来自专栏专知

春节充电系列:李宏毅2017机器学习课程学习笔记23之结构化学习-Structured SVM(part 1)

【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的Structured learning-linear model,这一节将主要针对讨论...

2964
来自专栏Petrichor的专栏

论文阅读: ResNet

ResNet论文是里程碑级的basemodel,因此获得了 CVPR 2016 Best Paper,并统领江湖至今:

1323
来自专栏用户3246163的专栏

2.2 线形回归

dependent = explained variable 已解释的 independent = explanatory variable 说明变量

1252
来自专栏智能算法

人脸识别经典算法:特征脸方法(Eigenface)

特征脸方法基本是将人脸识别推向真正可用的第一种方法,了解一下还是很有必要的。特征脸用到的理论基础PCA在之前的文章中已经讲过了。直接上特征脸方法的步骤:...

5135
来自专栏数据科学学习手札

(数据科学学习手札15)DBSCAN密度聚类法原理简介&Python与R的实现

DBSCAN算法是一种很典型的密度聚类法,它与K-means等只能对凸样本集进行聚类的算法不同,它也可以处理非凸集。 关于DBSCAN算法的原理,笔者觉得下面这...

38212
来自专栏文武兼修ing——机器学习与IC设计

基于sklearn的主成分分析理论部分代码实现

理论部分 特征降维 特征降维是无监督学习的一种应用:将n维的数据降维为m维的数据(n>m)。可应用于数据压缩等领域 主成分分析(PCA) 主成分分析是一种常用的...

2848
来自专栏智能算法

图像金字塔分层算法

一. 图像金字塔概述 1. 图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。 2. 图像金字塔最初用...

3746
来自专栏机器学习、深度学习

人脸检测识别文献阅读总结

1 在人脸检测的时候需要结合人脸特征点对齐来综合考虑人脸检测问题,因为人脸特征点对齐有助于提高人脸检测性能 下面的文献都论证了这个思想: Joint ...

3246

扫码关注云+社区