首页
学习
活动
专区
工具
TVP
发布

目标检测之传统检测器

如果我们认为今天的目标检测技术是借助深度学习力量的技术美学,那么回溯到20年前,我们将见证“冷兵器时代的智慧”。

大多数早期目标检测算法是建立在手工特征的基础上的,由于当时缺乏有效的图像描述,人们没有选择,只能设计复杂的特征描述和多种加速技术来极限利用有限的计算资源。

1. Viola Jones(VJ)检测器

18年前,P. Viola和M. Jones在没有任何约束(例如皮肤颜色分割)的情况下,第一次实现了实时人脸检测。运行在700MHz 奔腾3 CPU,该检测器能够在可比检测正确率下,比当时其他任何算法都要快十倍甚至上百倍都要快。该检测算法后来被称为VJ检测器,以此来纪念两位作者的重要贡献。

VJ检测器遵循了大多数检测直接方法,例如滑动窗口:在一张图像上去滑过所有可能的位置和尺寸,去看是否在该窗口中包含人脸。尽管其看起来是一个简单的过程,但其背后的计算量是远超当时的计算能力。VJ通过组合3种重要的技术来显著提供检测的速度:积分图像,特征选择,和级联检测。

1)积分图像:积分图像是一种加速box过滤或者卷积过程的计算方法。就像当时其他目标检测算法,Haar小波作为图像特征的描述也被用在了VJ检测器中。积分图像使得VJ检测器中每一个窗口的计算复杂度不依赖于窗口的大小。

2)特征选择:不是用一系列手动选择的Haar基滤波器,作者采用了Adaboost算法从一组巨大随机特征池(大约180k维)中选择了大部分对人脸检测有帮助的一小组特征。

3)级联检测:一个多阶段检测范式在VJ检测器中被引进,目的是减少计算开销,减少在背景窗口的计算,加大在人脸目标的计算。

2. HOG检测器

方向方向梯度直方图(HOG)特征描述算子是在2005被首次提出的。HOG在当时被认为是在尺度不变特征转换和形状上下文的一个重要进步。为了平衡特征的不变性(包含平移,尺度,光照等)和非线性(区分不同的目标种类),HOG描述符是在一个稠密的、空间分布一致的cells的栅格上进行计算的,用重复的局部对比度标准化来提供准确性。

尽管HOG可以被用来检测不同的目标种类,但其最初是用来解决行人检测的问题。为了能够检测不同的大小,HOG检测器在保持检测窗口大小不变的条件下,多倍的缩放输入图像。HOG检测器很长时间都是许多目标检测器和大量不同计算机视觉应用的重要基础。

3. Deformable Part-based Model(DPM)

DPM是VOC-07,-08和-09检测挑战的冠军,是传统目标检测方法的巅峰。DPM最初是2008年被P. Felzenszwalb作为HOG检测器扩展提出的,后来R. Girshick做了很多不同的改进。

DPM遵循“分而治之”的检测哲学,训练可以被简单认为是分解一个目标合适方法的学习。推断可以被认为是在不同目标部件上检测的总体展示。例如,检测一辆车的问题可以被认为是对其窗、车身和轮子的检测。这部分工作“星星模型”是被P. Felzenszwalb完成的,后来R. Girshick更进一步将“星星模型”扩展到了“混合模型”,在更重要的变化中处理现实世界的目标。

一个典型的DPM检测器是由一个根过滤器和许多部件过滤器组成的。不是手动的指定部件过滤器的配置(如大小和位置),DPM开发了一种弱监督学习方法,部件过滤器的所有配置可以自动作为潜在变量被学习到。R. Girshick还进一步将这个过程描述为多实例学习的特殊案例。一些其他重要的技术,例如难分样本发掘,bounding box回归和上下文启动,也别应用去提供检测准确度。为了加速检测,Girshick发明了一个将检测模型编译成执行级联架构更快模型的技术,再没有牺牲任何准确度上,实现了超过10倍的加速。

就检测准确性而言,今天目标检测已经远远超过了DPM,但他们中的许多还是被其有价值的见解所影响,例如混合模型,难分样本发掘,bounding box回归等。在2001年P. Felzenszwalb和R. Girshick被PASCAL VOC授予“终生成就奖”。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200505A03BRS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券