前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR21最佳检测:不再是方方正正的目标检测输出(附源码)

CVPR21最佳检测:不再是方方正正的目标检测输出(附源码)

作者头像
计算机视觉研究院
发布2021-07-09 16:18:37
7750
发布2021-07-09 16:18:37
举报

计算机视觉研究院专栏

作者:Edison_G

有些目标往往具有任意方向的分布。因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的...

论文:

https://openaccess.thecvf.com/content/CVPR2021/papers/Han_ReDet_A_Rotation-Equivariant_Detector_for_Aerial_Object_Detection_CVPR_2021_paper.pdf

源代码:

https: //github.com/csuhan/ReDet

1

简要

近年来,航空图像中的目标检测在计算机视觉中得到了广泛的关注。与自然图像中的目标不同,航空目标往往具有任意方向的分布。因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的。此外,由于普通的cnn没有明确地模拟方向变化,因此需要大量的旋转增强数据来训练精确的目标检测器。

研究者提出了一种旋转等变检测器(ReDet)来解决这些问题,该检测器对旋转等变和旋转不变性进行了显式编码。更准确地说,研究者在检测器中加入旋转等变网络来提取旋转等变特征,这样可以准确地预测方向,并大大减小模型尺寸。在旋转等变特征的基础上,提出了旋转不变RoI-Align(RiRoI-Align),该算法根据RoI的方向自适应地从等变特征中提取旋转不变特征。在DOTA-v1.0、DOTA-v1.5和HRSC2016等具有挑战性的航空影像数据集上进行的大量实验表明,新提出的方法能够在航空目标检测任务上达到最先进的性能。

2

背景

最近,许多设计良好的面向对象检测器被提出,并在具有挑战性的航空图像数据集上报告了有希望的结果。为了在无约束航空图像中实现精确的目标检测,大多数算法都致力于提取旋转不变特征。在实际应用中,旋转RoI(RRoI)扭曲(例如,rooi Pooling和rooi Align)是提取旋转不变特征最常用的方法,它可以根据二维平面上RRoI的边界框精确扭曲区域特征。然而,具有规则CNN特征的RRoI扭曲不能产生精确的旋转不变特征。通过使用更大容量的网络和更多的训练样本来模拟旋转变化,从而逼近旋转不变性。

如上图所示,规则cnn与旋转不等价,即向cnn传送旋转图像与原始图像的旋转特征映射不同。因此,从常规CNN特征图中扭曲出来的区域特征通常会随着方向的变化而变得不稳定。上图所示,新提出的方法由两部分组成:旋转等变特征提取和旋转不变特征提取。首先,将旋转等变网络引入到主干网络中,生成旋转等变特征,可以准确预测方向,降低建模的复杂度。由于直接应用RRoI扭曲仍然不能从旋转等变特征中提取旋转不变特征,研究者提出了一种新的旋转不变RoI对齐算法(RiRoI-Align)。

3

新框架

(a) Overall architecture of the proposed Rotation-equivariant Detector. We first adopt the rotation-equivariant backbone to extract rotation-equivariant features, followed by an RPN and RoI Transformer (RT) to generate RRoIs. Then we use a novel Rotation-invariant RoI Align (RiRoI Align) to produce rotation-invariant features for RoI-wise classification and bounding box (bbox) regression.

(b) Rotation-equivariant feature maps. Under the cyclic group CN , the rotation-equivariant feature maps with the size (K, N, H, W ) have N orientation channels, and each orientation channel is corresponding to an element in CN .

(c)RiRoI Align. The proposed RiRoI Align consists of two parts: spatial alignment and orientation alignment. For an RRoI (x, y, w, h, θ), spatial alignment warps the RRoI from the spatial dimension, while orientation alignment circularly switches orientation channels and interpolates features to produce completely rotation-invariant features.

4

实验结果

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-07-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像识别
腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档