级联人脸检测--Detecting Faces Using Inside Cascaded Contextual CNN

Detecting Faces Using Inside Cascaded Contextual CNN ICCV2017

这里也是使用级联思想来进行人脸检测,但是不是使用多个 CNN 网络来级联的,而是使用一个CNN中不同网络层来做级联的。简单的来说就是CNN网络的前几层完成简单的人脸检测,后面的网络完成难度较大的人脸检测。 同时使用 body part localization 来辅助人脸检测

real time performance

3 Overall Framework

本文的网络结构主要包括三个部分:人脸候选区域提取模块 Proposal Net (P-Net), two Refinement Nets (R-Net-1 and R-Net-2)

人脸候选区域提取模块 Proposal Net (P-Net) 是由全卷积网络构成的,采用滑动窗口的方式对 图像金字塔(多尺度输入图像)快速处理,得到人脸候选区域; R-Net-1 and R-Net-2 主要对第一步得到的候选区域进行去虚警和 矩形框坐标回归 bounding box regression

4 Inside Cascaded Structure ICS has two extra components, Early Rejection Classifier (ER-C) and Data Routing (DR) layer CNN网络的前几层完成简单的人脸检测,后面的网络完成难度较大的人脸检测, 这个策略可以让我们后面的网络专注于学习难度较大的人脸检测, deeper layers can focus on handling more difficult samples compared to traditional CNN。因为简单的非人脸区域在网络的前几层就被快速排除,这样整体的检测计算量就会降低。

4.1. Early Rejection Classifier ERC 是一个小型分类器,用于人脸区域的二分类判断。这个分类器得到的概率输入 next DR layer 依此来决定是否需要进行后续处理。

4.2. Data Routing Layer DR layer will change the sample set for the following network components 简单的说就是后续区域不断的减少,容易的负样本被剔除了。

An example of neural network in ERC and CNN architectures of P-Net, R-Net-1 and R-Net-2

6 Experiments

FDDB

WIDER FACE

Speed

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【智能】自然语言处理概述

1 什么是文本挖掘? 文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现。文本挖掘的准备工作由文本收集、文本分析和特征修剪三个步骤组成。目前研究和应用...

3595
来自专栏企鹅号快讯

基于神经网络的实体识别和关系抽取联合学习

作者丨罗凌 学校丨大连理工大学博士生 研究方向丨深度学习,文本分类,实体识别 联合学习(Joint learning)一词并不是一个最近才出现的术语,在自然语言...

5569
来自专栏SIGAI学习与实践平台

轻量化神经网络综述

深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中,并取得了巨大成功。然而,由于存储空间和功耗的限制,神经网络模型在嵌入式设备上的存储与计算仍然是一...

2974
来自专栏人工智能的秘密

用机器学习来预测天气Part 2

  这篇文章我们接着前一篇文章,使用Weather Underground网站获取到的数据,来继续探讨用机器学习的方法预测内布拉斯加州林肯市的天气。上一篇文章我...

3276
来自专栏语言、知识与人工智能

基于深度学习的FAQ问答系统

| 导语 问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于...

9K10
来自专栏大数据文摘

​tensorflow实现基于深度学习的图像补全

4755
来自专栏机器之心

资源 | CPU实时人脸检测,各种朝向都逃不过

作为 CV 重要的组成部分,人脸检测旨在利用卷积神经网络从人脸图像中抽取足够的信息。然而虽然 CNN 能高效处理图像数据,但大多数情况下它的设计都是针对一般图像...

613
来自专栏机器学习、深度学习

人脸检测--Supervised Transformer Network for Efficient Face Detection

Supervised Transformer Network for Efficient Face Detection ECCV2016 人脸检测: the...

2067
来自专栏人工智能LeadAI

R-CNN目标检测第三弹(Faster R-CNN)

今天,重看了 R-CNN 的终极改进版本 Faster R-CNN(NIPS 版)-本文提到的paper,若为特别指明,说的就是此版本。 先说一个学术趣事吧,...

3908
来自专栏机器学习与自然语言处理

“你什么意思”之基于RNN的语义槽填充(Pytorch实现)

3323

扫码关注云+社区