前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Cascade-DETR

Cascade-DETR

作者头像
iResearch666
发布2023-09-13 13:54:19
2810
发布2023-09-13 13:54:19
举报

Cascade-DETR: Delving into High-Quality Universal Object Detection

  • Paper https://arxiv.org/abs/2307.11035
  • Code https://github.com/SysCV/cascade-detr

Abstract

  • Transformer-based检测器在coco上占主导地位,但是在其它domain不具有竞争力——在复杂环境下泛化能力不佳
  • 本文提出了Cascade Attention layer, 通过限制注意力到先前的box预测来隐式地将物体中心信息整合到检测解码器。为了进一步提升准确率,预测查询的预期 IoU,从而大大提高了校准过的可信度
  • UDB10 Benchmark包含10类不同数据集, spanning traffic, medical, art, open-world, etc.

Related Work

  • DETR-based Object Detection
    • DN-DETR: as baseline
    • DINO
    • CNN-based
    • DETR-based :超过了CNN-based
  • Cross-attention in DETR-based Decoder
    • Deformable DETR: deformable attention
    • Mask2Former: mask attention for segmentation
  • High-quality Object Detection
    • first one
    • Cascade R-CNN
    • Dynamic R-CNN
    • FCOS
    • R-CNN based
    • DETR-based
  • DETR-based Universal Object Detection
    • COCO
    • UDB10

Contributions

  • Cascade Attention
  • IoU-aware Query Recalibration

Methodology

Overview

image-20230801161017608

image-20230801164536052

Cascade Attention

  • Why
    • 标准的DETR decoder中利用的是全局图像特征,本文认为(假设)query领域的local信息更加重要。在COCO上,交叉注意力map收敛到object位置的周边区域。之所以网络可以学习这种inductive bias,是因为数据量很大。所以对小批量数据或者多样性的数据并不合适。
  • How
    • 本文提出将目标中心prior作为已知约束整合到网络的初始化和训练过程,具体就是在decoder的每一层预测的box作为交叉注意力的范围进行约束。

    image-20230801164253653

  • What

image-20230801161702452

上图可见,attention map区域就是box区域,这种inductive bias使得DETR快速收敛且提升性能,尤其是在小数据集和多样性数据集上

IoU-aware Query Recalibration

  • Why
    • 分类得分没有显示考虑到预测的bbox准确率, 而高质量的propasals需要高的IOU
  • How
    • 在网络的最后一层增加了一个由linear layer构成的branch,用来预测IOU的期望,采用L2 loss

    image-20230801164218728

  • What

    image-20230801163453254

    • re-calibrated 更接近,具有更好的定位质量

Experiments

image-20230801164121735

image-20230801164045970

image-20230801163942235

image-20230801164351031

image-20230801164801157

Conclusions

  • 很强

References

  • DN-DETR: Accelerate DETR Training by Introducing Query DeNoising
    • https://arxiv.org/abs/2203.01305
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-08-01 18:00,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 iResearch666 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Abstract
  • Related Work
  • Contributions
  • Methodology
    • Overview
      • Cascade Attention
        • IoU-aware Query Recalibration
        • Experiments
        • Conclusions
        • References
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档