专栏首页我爱计算机视觉日本东北大学改进单阶段人脸检测—兼具速度与精度优势

日本东北大学改进单阶段人脸检测—兼具速度与精度优势

近日来自日本东北大学与Laboro.AI公司的研究人员公开一篇改进的单阶段人脸检测算法论文,其不仅保持了速度的优势而且在主流的人脸数据集上达到与双阶段人脸检测算法相当的精度。

作者信息:

按照算法流程划分,在目标检测领域一直存在着两大分支:

1.双阶段(Two-Stage)目标检测。网络先生成大量的目标候选区域和特征(或者像素),然后再通过另一个网络在其基础上进行目标分类和包围框位置回归。比如Faster R-CNN算法。

2.单阶段(Single-Stage)目标检测。在基础网络不同的深度提取特征图,每一层特征图都有与其对应的预定义的anchors,在这些特征图上直接进行目标分类和位置回归的卷积操作,得到最终的目标检测的结果。比如SSD算法。

双阶段目标检测算法往往能取得更高的检测精度,但单阶段的算法速度往往比较快,这在实际工程中是很重要的。

在人脸检测领域同样有如上的两条路线。

该文作者希望改进单阶段人脸检测算法,使其兼具速度和精度的优势。

问题提出

受启发于SSD、SFD、SSH算法,作者基于ResNet-101骨干网构建了单阶段的人脸检测基模型,透过研究发现导致模型虚警率(false positives)较高的主要因素有:

1.上下文信息缺失。尤其对小人脸特别明显,本身可区分度不高,上下文信息缺失更加难以检测。

2.感受野太大。大的感受野提供了冗余信息。

3.分类和检测共享相同的特征图。网络难以平衡分类和回归的损失函数。

4.anchors太过密集。提高了召回率但也提高了虚警率。

作者针对以上问题设计了对应改进策略,使得改进后的算法在主流的人脸检测数据集上精度都达到了state-of-the-art。

网络架构

如下图,

主要包括:Base convolutional layers( ResNet-101),Extra convolutional layers,Detection convolutional layers。

改进策略

1.融合更高层的特征图。

2.Detection模块分类和回归任务分离。

3.改进训练时anchors分配策略,降低数量。

实验证明,经过上述改进,降低了虚警率,如下图:

实验结果

作者分别在AFW、Pascal Face、FDDB、Wider Face四个数据集上进行了实验,达到了与双阶段检测算法state-of-the-art相当的精度。

甚至作者将该算法与Face++、Picase、Face.com商业公司的产品相比较,精度上也毫不逊色。

作者在Titan X GPU硬件上与其他算法进行了推断速度的比较,在精度可比较的范围,该文算法速度更具优势。在640*480图像上推断速度是26ms。

在Wider Face Validation hard set取得75.0%AP时每幅图像推断速度36ms,相比较CVPR2018的论文 Seeing Small Faces from Robust Anchor’s Perspective取得75.7%AP的推断速度是大于150ms。

人脸检测示例:

可惜的是,目前并未发现该文有开源代码。

论文地址:

https://arxiv.org/pdf/1902.01559v1.pdf

本文分享自微信公众号 - 我爱计算机视觉(aicvml),作者:CV君

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • PFLD:简单、快速、超高精度人脸特征点检测算法

    今天arXiv新发布的文章《PFLD: A Practical Facial Landmark Detector》,则是实用人脸特征点检测算法的典范。

    CV君
  • CVPR 2019 行人检测新思路:高级语义特征检测取得精度新突破

    今天跟大家分享一篇昨天新出的CVPR 2019论文《High-level Semantic Feature Detection:A New Perspectiv...

    CV君
  • 全方位!深度学习目标检测近年进展

    向大家推荐一篇今天新出的论文Recent Advances in Deep Learning for Object Detection,该文调查了2012年以来...

    CV君
  • PFLD:简单、快速、超高精度人脸特征点检测算法

    今天arXiv新发布的文章《PFLD: A Practical Facial Landmark Detector》,则是实用人脸特征点检测算法的典范。

    CV君
  • 干货 | 10W+ K8s容器数量下,携程如何打造统一弹性调度体系

    本文作者为携程Cloud Container团队的鸿飞,静雪,诗燕。该团队负责K8s容器平台的研发和优化工作,专注于推动基础设施云原生架构升级,以及创新产品的研...

    携程技术
  • 像TransactionScope一样使用DbTransaction

    System.Transactions.TransactionScope为了提供一种非常方便的实现分布式事务的方式,但是在某些情况下为了阻止本地事务向分布式事务...

    蒋金楠
  • 什么是 CI/CD?

    CI/CD 的出现改变了开发人员和测试人员发布软件的方式。本文是描述这一变化的系列文章第一篇,

    LinuxSuRen
  • 什么是 CI/CD?

    CI/CD 的出现改变了开发人员和测试人员发布软件的方式。本文是描述这一变化的系列文章第一篇, 这些文章将提供各种工具和流程的讲解,以帮助开发人员更好的使用 C...

    LinuxSuRen
  • 云计算是绿色产业吗?

    自从微软、谷歌联合发起云计算概念后,近两三年云计算风云突起,方兴未艾,其以超大的计算能力、超大的储存能力、超大规模的服务能力已经成为了全球IT领域最炙手可热的项...

    静一
  • 剑指Offer的学习笔记(C#篇)-- 构建乘积数组

    简而言之,给你一个数组,返回一个数组,返回的数组内容不包含A[i],注意题目中红色部分。也就是说,你返回的这个数组B,他的每一项都是数组A中除了...

    WeiMLing

扫码关注云+社区

领取腾讯云代金券