专栏首页计算机视觉战队20年的目标检测大综述(章节1)

20年的目标检测大综述(章节1)

不知不觉2020年“计算机视觉战队”陪伴大家快两个月了,由于疫情大家最近估计都没有吃好喝好,但是大家肯定玩的很High,我们也一直在陪伴,分享最好最有质量的知识,陪伴大家度过疫情。今天开始,我们准备分享一次综述性知识,有兴趣的同学加入我们一起来学习,共同进步!

目 录

1 INTRODUCTION

2 OBJECT DETECTION IN 20 YEARS

2.1 A Road Map of Object Detection

2.1.1 Milestones: Traditional Detectors

2.1.2 Milestones: CNN based Two-stage Detectors

2.1.3 Milestones: CNN based One-stage Detectors

2.2 Object Detection Datasets and Metrics

2.2.1 Metrics

2.3 Technical Evolution in Object Detection

2.3.1 Early Time’s Dark Knowledge

2.3.2 Technical Evolution of Multi-Scale Detection

2.3.3 Technical Evolution of Bounding Box Regression

2.3.4 Technical Evolution of Context Priming

2.3.5 Technical Evolution of Non-Maximum Suppression

2.3.6 Technical Evolution of Hard Negative Mining

3 SPEED-UP OF DETECTION

3.1 Feature Map Shared Computation

3.1.1 Spatial Computational Redundancy and Speed Up

3.1.2 Scale Computational Redundancy and Speed Up

3.2 Speed up of Classifiers

3.3 Cascaded Detection

3.4 Network Pruning and Quantification

3.4.1 Network Pruning

3.4.2 Network Quantification

3.4.3 Network Distillation

3.5 Lightweight Network Design

3.5.1 Factorizing Convolutions

3.5.2 Group Convolution

3.5.3 Depth-wise Separable Convolution

3.5.4 Bottle-neck Design

3.5.5 Neural Architecture Search

3.6 Numerical Acceleration

3.6.1 Speed Up with Integral Image

3.6.2 Speed Up in Frequency Domain

3.6.3 Vector Quantization

3.6.4 Reduced Rank Approximation

4 RECENT ADVANCES IN OBJECT DETECTION

4.1 Detection with Better Engines&Object detectors with new engines

4.2 Detection with Better Features

4.2.1 Why Feature Fusion is Important?

4.2.2 Feature Fusion in Different Ways

4.2.3 Learning High Resolution Features with Large Receptive Fields

4.3 Beyond Sliding Window

4.4 Improvements of Localization

4.4.1 Bounding Box Refinement

4.4.2 Improving Loss Functions for Accurate Localization

4.5 Learning with Segmentation

4.5.1 Why Segmentation Improves Detection?

4.5.2 How Segmentation Improves Detection?

4.6 Robust Detection of Rotation and Scale Changes

4.6.1 Rotation Robust Detection

4.6.2 Scale Robust Detection

4.7 Training from Scratch

4.8 Adversarial Training

4.9 Weakly Supervised Object Detection

5 APPLICATIONS

5.1 Pedestrian Detection

5.1.1 Difficulties and Challenges

5.1.2 Literature Review

5.2 Face Detection

5.2.1 Difficulties and Challenges

5.2.2 Literature review

5.3 Text Detection

5.3.1 Difficulties and Challenges

5.3.2 Literature Review

5.4 Traffic Sign and Traffic Light Detection

5.4.1 Difficulties and Challenges

5.4.2 Literature Review

5.5 Remote Sensing Target Detection

5.5.1 Difficulties and Challenges

5.5.2 Literature Review

6 CONCLUSION AND FUTURE DIRECTIONS

今天我们就先说说第一章:INTRODUCTION

目标检测是数字图像中某一类 ( 如人、动物或汽车 ) 的重要计算机视觉任务。目标检测的目标是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:什么目标在哪里?

目标检测作为计算机视觉的基本问题之一,是许多其他计算机视觉任务的基础,如实例分割、图像字幕、目标跟踪等。从应用程序的角度来看,目标检测可以被分为两个研究主题:“ General Object Detection ” 和 “ Detection Applications ” ,前者旨在探索在统一的框架下检测不同类型物体的方法,以模拟人类的视觉和认知;后者是指特定应用场景下的检测,如行人检测、人脸检测、文本检测等。

近年来,随着深度学习技术的快速发展,为目标检测注入了新的血液,取得了显著的突破,将其推向了一个前所未有的研究热点。目前,目标检测已广泛应用于自主驾驶、机器人视觉、视频监控等领域。下图就显示了过去二十年中与 “ 目标检测 ” 相关的出版物数量的增长。

区别

近年来发表了许多关于 General Object Detection 的综述。本文与上述综述的主要区别总结如下:

  1. 基于技术演进的全面回顾:本文广泛回顾了对象检测发展史上的400多篇论文,时间跨度超过25年 ( 上世纪90年代至2019年 )。以前的大多数综述仅仅关注一个较短的历史时期或一些特定的检测任务,而没有考虑它们整个生命周期中的技术演进。站在历史的高速公路上,不仅有助于读者建立一个完整的知识体系,而且有助于找到这个快速发展领域的未来方向。
  2. 深入探索关键技术和最新技术状态:经过多年的发展,目前的先进的对象检测系统已经与 “ 多尺度检测 ”、“ 困难负样本挖掘 ” 、“ 边界框回归 ” 等大量技术相结合,然而,以前的综述缺乏基本的分析来帮助读者理解这些复杂技术的本质,例如,“ 它们从哪里来,它们是如何进化的? ”、“ 每种方法的优缺点是什么? ”本文针对上述问题对读者进行了深入的分析。
  3. 全面分析加速检测技术:加速目标检测一直是一项关键而又具有挑战性的任务。本文从多个层面对近20年来目标检测技术的发展进行了全面的回顾,包括 “ 检测管道 ” ( 如级联检测、特征图共享计算 )、“ 检测主干 ”( 如网络压缩、轻量级网络设计 )、“ 数值计算 ”( 如积分图像、矢量量化 )。以前的综述很少涉及这个主题。

难点和挑战

尽管人们总是问 “ 在目标检测中有哪些困难和挑战? ” ,事实上,这个问题并不容易回答,甚至可能被过度概括。由于不同的检测任务具有完全不同的目标和约束,它们的困难程度可能会有所不同。除了其他计算机视觉任务中的一些常见挑战,如不同视点下的物体、光照和类内变化,目标检测的挑战包括但不限于以下几个方面:目标旋转和尺度变化 ( 如小目标 ) ,精确的目标定位,密集和遮挡的目标检测,加速检测等。

在之后的第四章和第五章中,我们将对这些主题进行更详细的分析。

本文分享自微信公众号 - 计算机视觉战队(ComputerVisionGzq),作者:计算机视觉

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-02-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • xYOLO | 最新最快的实时目标检测

    随着物联网(IoT)、边缘计算和自主机器人等领域的车载视觉处理技术的出现,人们对复合高效卷积神经网络模型在资源受限的硬件设备上进行实时目标检测的需求越来越大。...

    计算机视觉研究院
  • 目标检测集 | ECCV 2020 论文大盘点(附论文&代码下载)

    不知不觉2020年已经进入11月,ECCV2020也告一段落,今天“计算机视觉研究院”给大家分享目标检测领域优秀的算法及框架!主要包括:弱监督目标检测、目标检测...

    计算机视觉研究院
  • 检测与识别人与目标之间的互动

    深度学习有在新的高度得到大家的认可,并驱使更多的爱好者去学习、去探索,已不仅仅在图像、视频及语音领域得到重视。现在在SLAM、NLP、医学、经济学等领域都得到愈...

    计算机视觉研究院
  • 谈一谈|下载软件的门道你懂吗?

    当我们在下载一些软件时我们经常会遇到这样一个问题—软件的后缀为什么有这么多?该下载哪一个?这些后缀是什么意思?如图:

    算法与编程之美
  • C#版 - Leetcode 762. 二进制表示中质数个1置位 - 题解

    762.Prime Number of Set Bits in Binary Representation

    Enjoy233
  • 5G安全的棘手问题(Security)

    仅在几年前,在文章标题中加上“移动电信安全性”一词即可获得在文章下面撰写任何内容的许可,因为除了标题没有人会关心具体内容。而如今5G的热门程度已经改变了这一点,...

    吴亚芳
  • RPC详解

    RPC(Remote Procedure Call),即远程过程调用,是一个分布式系统间通信的必备技术,本文体系性地介绍了 RPC 包含的核心概念和技术,希望读...

    sunsky
  • 有限域的基本概念和质数、不可分解多项式的搜寻算法

    有限域(Finite Field)在数学上属于群论(Group Theory)的范畴,又称伽罗瓦域(Galois Field)。简单来说,就是包含有限个元素的域...

    icsoc
  • CentOS 7.2 安装Clam AntiVirus

    版权声明:本文为木偶人shaon原创文章,转载请注明原文地址,非常感谢。 https://b...

    shaonbean
  • 你问我答 | 云直播(CSS)年度关心问题解答

    年度云直播(CSS)最为关心的问题汇总整理,希望可以帮助到您。 ?

    腾讯云视频

扫码关注云+社区

领取腾讯云代金券