专栏首页我爱计算机视觉全方位!深度学习目标检测近年进展

全方位!深度学习目标检测近年进展

常见视觉任务,图(b)为目标检测

向大家推荐一篇今天新出的论文Recent Advances in Deep Learning for Object Detection,该文调查了2012年以来的256篇深度学习目标检测的文献,用40页的篇幅由远及近、有浅入深从目标检测算法组件、学习策略、应用与基准测评三个角度展现了该领域近年进展,内容详实而全面,非常值得参考。

该文作者信息:

作者来自新加坡管理大学、Salesforce亚洲研究中心。

本文仅提纲挈领其部分内容,想要细致考察该领域的朋友欢迎在“我爱计算机视觉”公众号对话界面回复“目标检测进展”,查看论文原文。

深度学习目标检测算法的里程碑:

该图横轴以上代表著名的目标检测算法,从OverFeat到DetNas,横轴以下代表著名的网络结构,从AlexNet到EfficientNet。

下图为该文总结的目标检测所涉及的主要内容,检测组件、学习策略、应用和基准测试:

著名的二阶段目标检测算法网络结构示意图:

著名的一阶段目标检测算法网络结构示意图:

特征表示部分多尺度学习的四种形式:

分别为图像金字塔、预测金字塔、集成特征、特征金字塔。

目标检测的度量标准汇总:

著名目标检测算法在PASCAL VOC 数据集上的检测结果汇总:

著名目标检测算法在MS COCO数据集上检测结果汇总:

未来展望

作者在近年趋势基础上对未来目标检测的发展方向进行了展望:

1)Scalable Proposal Generation Strategy 可扩展的候选区域生成策略

尤其是anchor-free相关的算法是最近的热点。

2)Effective Encoding of Contextual Information 上下文信息的有效编码

上下文信息对于理解视觉世界是非常重要的,但目前这方面的文献还比较匮乏。

3)Detection based on Auto Machine Learning(AutoML) 基于AutoML的检测算法

这虽是非常耗GPU的一个方向,但新出的工作不少,也取得了很不错的效果。

4)Emerging Benchmarks for Object Detection 新的目标检测基准测试数据集

MS COCO虽然被广泛应用,但其仅有80类。而新出的LVIS数据集含有1000+个类别,164000幅图像,总计220万高质量实例分割Mask,各类别目标数量差异也很大。

A. Gupta, P. Dollar, R. Girshick, Lvis: A dataset for large vocabulary instance segmentation, in: CVPR, 2019.

5)Low-shot Object Detection 少样本目标检测

业界已经提出了一些算法,但还有很大改进空间。

6)Backbone Architecture for Detection Task 适用于目标检测的骨干网结构

大部分SOTA检测算法使用分类的骨干网,仅有少量算法使用检测专用骨干网。

7)Other Research Issues 其他研究话题

比如大批量学习、增量学习等。

论文地址:

https://arxiv.org/abs/1908.03673v1

在“我爱计算机视觉”公众号对话界面回复“目标检测进展”,即可收到论文下载。

本文分享自微信公众号 - 我爱计算机视觉(aicvml),作者:CV君

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • OpenCV多目标跟踪与视频分析

    在视频监控与分析中,视频前后景分析、多目标检测、目标跟踪等算法需要协同工作,今天跟大家分享的开源库,给出了一个基于OpenCV的开源实现。供大家学习参考。

    CV君
  • GNN用于3D目标检测,表现SOTA,CMU开辟新方向

    分享一篇今天新出的论文Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cl...

    CV君
  • 目标检测:Segmentation is All You Need ?

    对于目标检测,从滑动窗口时代开始,我们已经习惯了候选区域特征提取然后分类的套路,深度学习时代强大的特征表示能力让我们能够探索不一样的道路,比如:

    CV君
  • 【西安交大】2020年最新深度学习目标检测方法综述

    目标检测的任务是从图像中精确且高效地识别、定位出大量预定义类别的物体实例。随着深度学习的广泛应用,目标检测的精确度和效率都得到了较大提升,但基于深度学习的目标检...

    深度学习技术前沿公众号博主
  • 机器学习在自动驾驶中的应用-以百度阿波罗平台为例【上】

    自动驾驶是人工智能当前最热门的方向之一,也是未来将对人类生活会产生重大影响的方向。机器学习在自动驾驶中有举足轻重的地位,从环境感知到策略控制,都有它的身影。在本...

    SIGAI学习与实践平台
  • 目标检测最新总结与前沿展望

    从 2006 年以来,在 Hilton、Bengio、LeChun 等人的引领下,大量深度神经网络的论文被发表,尤其是 2012 年,Hinton课题组首次参加...

    SIGAI学习与实践平台
  • 大型网站的可伸缩性架构如何设计?

    将不同功能分离部署可以实现一定程度的伸缩性,但是随着网站的访问量逐步增加,即使分离到最小粒度的独立部署,单一的服务器也不能满足业务规模的要求。因此必须使用服务器...

    李红
  • 亿级Web系统负载均衡几种实现方式

    负载均衡(Load Balance)是集群技术(Cluster)的一种应用技术。负载均衡可以将工作任务分摊到多个处理单元,从而提高并发处理能力。目前最常见的负载...

    黄泽杰
  • 测试思想 什么是软件测试(摘录)

    IEEE 标准的定义:使用人工或自动的手段来运行或测定某个系统的过程,其目的在于检验;它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。对软件测试还有...

    授客
  • 即学即用的 30 段 Python 实用代码

    原标题 | 30 Helpful Python Snippets That You Can Learn in 30 Seconds or Less

    Rocky0429

扫码关注云+社区

领取腾讯云代金券