专栏首页CVer盘点性能最强的One-stage目标检测算法

盘点性能最强的One-stage目标检测算法

前言

要知道衡量目标检测最重要的两个性能就是 精度和速度,特指 mAP 和 FPS。其实现在很多论文要么强调 mAP 很高,要么就是强调 mAP 和 FPS 之间 Trade-off 有多好。

目前的目标检测论文主要分为两大类:One-stage 和 Two-stage(还有部分是 Multi-stage),其中 One-stage 相对于 Two-stage 在性能方面的表现就是 FPS 会高一点,即速度相对要快一点。

本文就来盘点一下 One-stage 最强的目标检测算法,Amusi 将在COCO数据集上 mAP 最高的 One-stage 算法认为是"性能最强" One-stage 目标检测算法。虽然 One-stage 目标检测算法的 mAP 并不是最高的,但因为普遍具有速度优势(个人觉得也就是落地应用价值),所以目前的研究有很多。

注:下一篇盘点应该会介绍 FPS最大(速度最快)的目标检测算法,如果想尽早看到,请给这篇文章点个"在看",如果点击"在看"的人多,速度最快的目标检测算法大盘点也会尽快推出!

时间:2019.08.07

盘点内容:One-stage 目标检测 mAP 最高的算法

说到 One-stage 目标检测算法,大家脑子里最先蹦出来的算法应该是 YOLO系列和 SSD系列。

这两个 One-stage "王者" 代表算法已经发表有段时间了,SSD 发表于2015.12,而 YOLOv3 发表于 2018.04。

最近 One-stage 目标检测相关的论文,比较典型的有:CornerNet、ExtremeNet、FoveaBox、FSAF、FCOS、FoveaBox、RepPoints、两个 CenterNet 和 CornerNet-Lite等。

这么多目标检测算法,究竟哪家最强呢?!

One-stage 性能最强的目标检测算法

这里 Amusi 罗列几个 One-stage mAP很强很强的算法,并以时间线的角度来展示。

注意:各个网络使用不同backbone,或加不同的tricks,都会有不同的 mAP。所以Amusi 只介绍所能查到最强的算法或者最强组合算法。而且测试 mAP的时候可能会有 single-scale 和 multi-scale 两种情况,这里只讨论 single-scale。

FSAF: Feature Selective Anchor-Free Module for Single-Shot Object Detection

mAP:42.9

FPS:5.3

Date:2019.03.02 (未开源)

arXiv:https://arxiv.org/abs/1903.00621

FCOS: Fully Convolutional One-Stage Object Detection

mAP:43.2

FPS:None

Date:2019.04.02(已开源)

arXiv:https://arxiv.org/abs/1904.01355

https://github.com/tianzhi0549/FCOS

原论文 mAP是 42.1,但开源的代码里又优化为 43.2

CenterNet:Objects as Points

mAP:42.1

FPS:7.8

Date:2019.04.16(已开源)

arXiv:https://arxiv.org/abs/1904.07850

https://github.com/xingyizhou/CenterNet

CenterNet: Keypoint Triplets for Object Detection

mAP:44.9

FPS:3

Date:2019.04.17 (已开源)

arXiv:https://arxiv.org/abs/1904.08189

https://github.com/Duankaiwen/CenterNet

AlignDet:Revisiting Feature Alignment for One-stage Object Detection

mAP:44.1

FPS:5.6

Date:2019.08.06 (未开源)

arXiv:https://arxiv.org/abs/1908.01570

综上所述,Amusi 将 CenterNet 和 AlignDet 两个算法认为是目前(2019.08.07) One-stage 目标检测方向性能最强的算法,其中:

- CenterNet 的 mAP/FPS :44.9/3

- AlignDet 的 mAP/FPS :44.1/5.5

本文分享自微信公众号 - CVer(CVerNews)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【技术综述】一文道尽传统图像降噪方法

    图像预处理算法的好坏直接关系到后续图像处理的效果,如图像分割、目标识别、边缘提取等,为了获取高质量的数字图像,很多时候都需要对图像进行降噪处理,尽可能的保持原始...

    用户1508658
  • 深入机器学习系列之Word2Vec

    word2vec的核心是神经网络的方法,采用 CBOW(Continuous Bag-Of-Words,即连续的词袋模型)和 Skip-Gram 两种模型,通过...

    数据猿
  • 【AI初识境】从头理解神经网络-内行与外行的分水岭

    上一次我们讲述了人工智能的完整历史,自从图灵提出了“机器智能”,达特茅斯会议提出“人工智能”学科后,研究人员就开始活跃起来。

    用户1508658
  • 【技术综述】一文道尽R-CNN系列目标检测

    目标检测任务关注的是图片中特定目标物体的位置。一个检测任务包含两个子任务,其一是输出这一目标的类别信息,属于分类任务。其二是输出目标的具体位置信息,属于定位任务...

    用户1508658
  • Python笔记(第五章)

    什么是格式化操作符呢?看一个符号 % 没错就是它,它在左右均为数字时为求余数,但它出现在字符中,表示的就是格式化操作符了,如下是格式化操作符的符号以及含义...

    天钧
  • 牺牲时间换取更少的空间,牺牲空间换取更快的时间!

    我们都知道,遍历一个list(列表)有两种方式,一种是直接输出list的对象,还有一种是使用for去迭代。这两者的区别,我将从时间和空间两方面来考虑,为了明显一...

    不可言诉的深渊
  • Python笔记(第四章)

    发现没有变化,如果看过元组那一章的小伙伴们,或者有底子的,可能发现了问题所在,没错,少了从新赋予,在这里温习一下如下

    天钧
  • 【AI初识境】从3次人工智能潮起潮落说起

    智能,即Intelligence,那什么是智能呢?按照中国古代思想家荀子在《荀子·正名篇》的说法:“所以知之在人者谓之知,知有所合谓之智。所以能之在人者谓之能,...

    用户1508658
  • 简单密码学总结1.0

    摩尔斯电码由两种基本信号组成:短促的点信号“·”,读“滴”;保持一定时间的长信号“—”,读“嗒”。间隔时间:滴=1t,嗒=3t,滴嗒间=1t,字符...

    天钧
  • 使用XML-RPC共享文件(1):初次实现

    本项目是一个简单的文件共享应用程序。通过Napster(最初形式的版本已不能下载)、Gnutella(有关可用客户端的讨论,请参阅http://www.gnut...

    不可言诉的深渊

扫码关注云+社区

领取腾讯云代金券