学习
实践
活动
专区
工具
TVP
写文章

脸太大计算机无法识别?这儿有一个优雅的技术解决方案

导语由于现实图片往往具有多个物体和复杂的背景,目标检测一直是计算机视觉领域研究的难点也是热点。其中,对于目标尺度的差异卷积神经网络模型没有应对的内在机制。ICCV2017的一篇论文中,设计了更优雅更快速地处理人脸检测中的尺度问题的方案,下面是对这篇论文的解读。

由于现实图片往往具有多个物体和复杂的背景,目标检测一直是计算机视觉领域研究的难点也是热点。在深度学习引入以前,早期的目标检测算法大多都是基于手工特征构建,比如行人检测使用的HOG特征,人脸检测使用的Harr特征。但是,手工提取的特征表达能力会受到提取特征方法的限制,往往只能针对特定目标提出特定的提取特征的方法,缺乏灵活性。大家想到有没有一种通用的方法能使提取出来特征更加鲁棒,表达能力更强呢?有!

深度学习中的卷积神经网络(CNN)在图像分类领域可以说是大获成功。随着对卷积神经网络研究的加深特别是迁移学习的成功应用,研究者们想到可以将卷积神经网络作为目标检测的特征提取器。Girshick等人[1]在2013年提出了R-CNN模型并且在VOC2007数据集上一下子将mAP从33.7%(DPM-v5传统方法)提高到58.5%。R-CNN论文传送门:自此,目标检测进入了深度学习的时代。

论文核心思路我们今天要介绍的这一篇文章(ICCV2017),是一篇比较新的目标检测方面的论文,主要想解决的是如何更优雅更快速地处理人脸检测中的尺度问题。对于目标检测的任务来说,需要应对的主要问题是目标在不同图像中具有外观、位置和尺寸的差异。外观差异可以通过卷积和池化的操作得到缓解,位置差异可以使用滑窗解决,但是对于目标尺度的差异问题,卷积神经网络模型没有应对的内在机制。

图1第一种解决方案:单尺度检测器和多尺度输入图像(Multi-shotbysingle-scaledetector).如图1(a)所示,将原图放缩成不同的尺度从而能够得到一个固定尺度的目标。图中的small,middle,large代表的是目标也就是人脸的尺度大小,如果人脸的尺度很大,那么就需要我们将原图缩放到一个更小的尺度从而得到一个固定的尺度。

图2首先图片进入第一部分的尺度预测网络(scale-forecastnetwork,如图2(a)),尺度预测网络负责对人脸的尺度做出一个估计预测。然后将人脸尺度的预测结果传给第二部分的循环尺度估计单元recurrentscaleapproximation(RSA)unit(如图2(b)),循环尺度估计单元能够产生预测的人脸尺度所对应的特征图。

总的来说RSA(·)是从输入的最大尺度的特征图到所需的1/2m倍的特征图的一个近似。相比先将图片I放缩m倍然后通过卷积网络得到特征图的方式,通过RSA(·)来计算特征图消耗的计算量要小得多。

图3RSA单元的一个展开版本,用于预测更小尺度的特征地图fm,真实标记为gm。从图上可以看出RSA单元预测出的特征图能够在各个更小的尺度上得到很好的近似。主要结论

图4训练好的scale-forecastnetwork在三个数据集上的测试结果。横轴x为总预测出的尺度数量/总人脸数量,纵轴是召回率recall表示正确预测结果数量/总真实尺寸数量。从召回率上来看,在x=1时召回率几乎是99%,意味着平均一张人脸只需要不到两个预测结果即可找到所有的人脸尺度。

图5展示的是在ResNet-18不同深度的卷积层后面插入RSA单元的效果。纵轴的错误率是用来衡量RSA估计出的特征图和真实特征图之间的差异。从图上容易得到两个结论:1.在越深的层插入RSA单元,RSA的性能越差。在最后一层插入的错误率甚至将近100%。这个结果说明深层的抽象特征几乎没有信息让RSA来对更小尺度的特征图进行推断。

图6论文提出的算法与其他人脸检测的state-of-the-art算法相比有大幅度的领先。结语这篇论文继承了近年来目标检测领域的许多杰出算法的思想,提出了尺度预测网络和RSA单元,很好地应对了人脸检测中的尺度变化,同时节省了大量计算,最后同样改进了预测模型,对于人脸检测达到了state-of-the-art。推荐课程

集智QQ群|292641157商务合作及投稿转载|swarma@swarma.org加入“没有围墙的研究所”让苹果砸得更猛烈些吧!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180718A0KBYK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券