人脸检测--Faceness-Net: Face Detection through Deep Facial Part Responses

Faceness-Net: Face Detection through Deep Facial Part Responses PAMI2017 From Facial Parts Responses to Face Detection: A Deep Learning Approach ICCV2015 http://shuoyang1213.me/projects/Faceness/Faceness.html https://pan.baidu.com/s/1qWFwqFM Password: 4q8y

本文针对人脸检测问题,从 facial attributes 的角度来解决人脸检测中的 severe occlusions 和 large pose variation

在人脸检测中使用 facial attributes supervision 的好处: 1)Discovering facial parts responses supervised by facial attributes 人脸具有唯一的结构 2) Computing faceness score from responses configurations 由人脸的局部到整体的推导 3) Refining the face hypotheses 人脸候选区域的进一步验证

本文和我们以前的工作【24,25】相比较,主要的改进在于设计了一个更有效的CNN,提高了速度和精度,具体改进有: 1)以前我们是用独立的网络来学习各个 facial parts,现在 我们共享了这些部件特征, share feature representations between these attribute-aware networks,这么做降低网络的参数量(( ∼ 83% fewer parameters),同时提升了网络的鲁棒性 2)候选区域提取模块嵌入到整个网络中,而不是独立的模块 This design not only leads to improved computation efficiency but also higher recall rate 3)更多的分析和实验

3 Faceness-Net

算法的整个流程是首先进行人脸局部特征的检测,然后从局部到整体得到人脸候选区域,再对人脸候选区域进行人脸识别和矩形框坐标回归

First stage 每个人脸局部特征我们使用一个CNN来检测 attribute-aware networks,一共五个特征属性: hair, eyes, nose, mouth, and beard 有了局部特征属性的响应,有局部推理出人脸候选区域

Second stage 训练一个多任务的CNN来完成人脸二分类和矩形框坐标回归 face classification and bounding box regression are jointly optimized

3.1 Attribute-Aware Networks Network structure 网络结构

Shared representation 特征共享 网络的前半部分网络参数基本一样,所以可以实现共享, 降低网络参数量 83%

3.2 Learning to Generate Partness Maps

人脸局部属性归类

3.3 Generating Candidate Windows 一般来说有两种方法可以用于候选区域生成:Generic object proposal 和 Template proposal(RPN)。但是这两种方法都是针对 generic objects 设计的,not suitable to propose windows specific to faces。我们提出了一个针对人脸的好方法 3.4

3.4 Ranking Windows by Faceness Score

3.5 Face Detection These face proposals can be subsequently fed to the multi-task CNN

fine-tune the first branch of the multi-task CNN for face classification and the second branch for bounding box regresssion

The runtime of the proposed Faceness-Net-SR-TP is 40 ms on a single Nvidia Titan X GPU. The time includes 10 ms to generate faceness proposals with the height of testing image no more than 300 pixels.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

一文带你认识深度学习中不同类型的卷积

卷积(convolution)现在可能是深度学习中最重要的概念。靠着卷积和卷积神经网络(CNN),深度学习超越了几乎其它所有的机器学习手段。 ? 这篇文章将简要...

4399
来自专栏null的专栏

简单易学的机器学习算法——线性可分支持向量机

一、线性可分支持向量机的概念     线性可分支持向量机是用于求解线性可分问题的分类问题。对于给定的线性可分训练数据集,通过间隔最大化构造相应的凸二次优化问题可...

3865
来自专栏AI科技评论

开发 | 用 Kaggle 经典案例教你用 CNN 做图像分类!

前言 在上一篇专栏中,我们利用卷积自编码器对 MNIST 数据进行了实验,这周我们来看一个 Kaggle 上比较经典的一个图像分类的比赛 CIFAR( CIFA...

4016
来自专栏专知

理解多层CNN中转置卷积的反向传播(附代码)

1.3K3
来自专栏贾志刚-OpenCV学堂

VGG卷积神经网络模型解析

一:VGG介绍与模型结构 VGG全称是Visual Geometry Group属于牛津大学科学工程系,其发布了一些列以VGG开头的卷积网络模型,可以应用在人脸...

4414
来自专栏林德熙的博客

C# 已知点和向量,求距离的点

已知一个点 P 和向量 v ,求在这个点P按照向量 v 运行距离 d 的点 B 。

2713
来自专栏技术随笔

深度学习 — 反向传播(BP)理论推导"BP" Math Principle前向传播反向传播应用实例Reference

4956
来自专栏我是攻城师

opencv里面直方图的意义

直方图是一种图表类型,在计算机视觉领域通常用来指反映图片的亮度,色彩,强度在整个图片里面的分布情况。直方图我们可以理解成另一种理解图片的方式。

4546
来自专栏SIGAI学习与实践平台

动手训练模型系列:过拟合与训练集规模

loss值采用Cross_entropy计算,表征训练/测试样本与实际训练/测试分类结果的总误差。

1152
来自专栏Pytorch实践

Pytorch实现Logistic回归二分类

? 摘要:本文主要介绍使用深度学习框架Pytorch实现简单的Logistic回归模型,进而实现简单的分类问题。 一.逻辑回归简述 逻辑回归实质上是线性回...

1.2K14

扫码关注云+社区