前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >标签分配 | SASM,形状自适应的样本选择策略

标签分配 | SASM,形状自适应的样本选择策略

作者头像
Justlovesmile
发布2023-03-08 15:08:16
9810
发布2023-03-08 15:08:16
举报
文章被收录于专栏:云+分享云+分享

1. 论文信息

论文标题:《Shape-Adaptive Selection and Measurement for Oriented Object Detection》

论文发表:AAAI 2022 论文链接:https://ojs.aaai.org/index.php/AAAI/article/view/19975 论文代码:https://github.com/houliping/SASM

代码语言:javascript
复制
@inproceedings{hou2022shape,
  title={Shape-adaptive selection and measurement for oriented object detection},
  author={Hou, Liping and Lu, Ke and Xue, Jian and Li, Yuqiu},
  booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
  volume={36},
  number={1},
  pages={923--932},
  year={2022}
}

Name

Value

标签

#标签分配 #旋转目标检测

数据集

#DOTA #HRSC2016 #UCAS-AOD #ICDAR2015

目的

解决旋转目标检测中样本选择没有考虑目标形状信息、没有区分不同质量正样本的问题

方法

提出shape-adaptive selection以及shape-adaptive measurement

2. 问题背景

作者提到旋转目标检测仍然面临挑战,其中最主要的挑战来自目标的形状(如长宽比)。在通用目标检测任务中,样本选择(sample selection,也叫标签分配,label assignment)对于性能提升具有重要作用。然而现有的样本选择策略存在以下不足:

  • 忽视了目标的形状信息
  • 没有对选择的正样本的做潜在的区分
  • 大多数方法只能用于anchor-free或者anchor-based,不能同时适用

3. 主要工作

针对上述问题,作者提出了shape-adaptive selection(SA-S)和shape-adaptive measurement(SA-M)策略。

  • SA-S:根据目标形状信息和特征分布动态地选择样本
  • SA-M:度量定位能力,针对所选正样本增加质量信息

3.1 模型结构

3.2 Motivation

作者做了一个实验,分析不同正负样本IoU划分阈值对不同长宽比类别性能的影响,可以发现当长宽比变大时,IoU阈值越小越好,这可以说明传统的固定IoU阈值的划分方式并不是最优的。

3.3 Shape-Adaptive Selection

根据ATSS,目标真值和预测值的IoU均值和方法可以用于计算动态的IoU阈值,因此对于第i个真值框,IoU阈值可以计算为:

\tau_i^{IoU}=f(y_i)\times(\mu+\sigma)

其中:

\mu = \frac{1}{J}\sum\limits^{J} _ {j=1} I _ {i,j}

\sigma=\sqrt{\frac{1}{J}\sum _ {j=1}^J(I _ {i,j}-\mu)^2}

代表真值框的长宽比。 根据上面的分析,权重应该随着纵横比的增加而减小,因此长宽比较大的目标被分配一个较低的IoU阈值,故而:

f(y_i)=e^{-\frac{y_i}{\omega}}

其中ω是一个权重参数,默认为4。当数据集包含大量大长宽比目标时,较大的ω通常可以获得更好的性能。这样,当IoU大于等于\tau_i^{IoU}时,认为其是正样本。

3.4 Shape-Adaptive Measurement

作者认为与位于物体内部的点相比,位于物体边界附近的点包含更多关于杂波背景,甚至附近物体的信息。因此,位于物体内部的点,特别是位于物体中心周围的点,比位于物体边界附近的点更能代表物体的特征。因此如果用所有正样本都有同样的权重会导致一些高质量正样本被远离物体中心的低质量样本点抑制,且每个样本点的质量与物体的形状密切相关,而不仅仅与每个点到物体中心的距离有关。

,其分别代表中心点坐标,宽度,高度和角度。归一化形状距离计算如下:

\Delta d _ {ij}=\begin{equation} \begin{array}{lr} \sqrt{\frac{(x _ i-x _ j)^2}{w _ i}+\frac{(y _ i-y _ j)^2}{h _ i}}, & 0\leqslant\theta _ i\leqslant\frac{\pi}{2} \\ \sqrt{\frac{(x _ i-x _ j)^2}{h _ i}+\frac{(y _ i-y _ j)^2}{w _ i}}, & otherwise \end{array}\end{equation}

3.5 损失函数

作者认为较大偏差的孤立点会极大地影响凸包(convex hull,其由预测点集计算得到)的质量,并对精确定位产生不利影响,因此提出了边界中心损失(Boundary-Center Loss),其从点集中选取最左点、最右点、最上点和最下点,用点集中所有点的x坐标和y坐标的平均值来计算平均中心点:

L^{bc}=\sum\limits _ {i=1}^{5}L _ {smooth}(p _ i,g _ i)

因此总损失为:

L=\lambda _ 1L^c+\lambda _ 2L^1+\lambda _ 3L^2

是权重系数,根据经验设为1.0,0.375和1.0. 其中分类损失计算为:

L _ i^c=\frac{1}{N^+}\frac{1}{\sum _ {p _ j\in{P^+}}\bar{Q} _ {ij}}\sum\limits _ {ij}\bar{Q} _ {ij}

代表focal loss。初始检测损失为:

L^1 _ i=\frac{1}{N^+}\frac{1}{\sum _ {p _ j\in{P^+}}\bar{Q} _ {ij}}\sum\limits _ {ij}\bar{Q} _ {ij}L _ {ij}^{reg}+L^{bc} _ {ij}

代表GIoU Loss。精炼阶段检测损失为:

L^2 _ i=\frac{1}{N^+}\frac{1}{\sum _ {p _ j\in{P^+}}\bar{Q} _ {ij}}\sum\limits _ {ij}\bar{Q} _ {ij}L _ {ij}^{reg}

4. 实验结果

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 论文信息
  • 2. 问题背景
  • 3. 主要工作
    • 3.1 模型结构
      • 3.2 Motivation
        • 3.3 Shape-Adaptive Selection
          • 3.4 Shape-Adaptive Measurement
            • 3.5 损失函数
            • 4. 实验结果
            相关产品与服务
            图像识别
            腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档