目标检测--RON: Reverse Connection with Objectness Prior Networks for Object Detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection CVPR2017 https://github.com/taokong/RON

本文可以看作是对 SSD 的改进, SSD 对不同尺度特征图进行独立的检测,这里我们 reverse connection block 将相邻的特征图联系起来。同时使用 objectness prior 来有效降低目标的搜索空间。

3 Network Architecture 我们使用 VGG16 作为基础模型, VGG16有13个卷积层,3个全连接层,这里我们将 第 14,15 全连接层变为卷积层,使用一个2×2卷积核 步长为2 来降采样 FC7 的尺寸。用于检测的特征图尺寸分布为输入图像尺寸的 1/8 (conv 4 3), 1/16 (conv 5 3), 1/32 (conv 6) and 1/64 (conv 7)

RON object detection overview

3.1. Reverse Connection 怎么把相邻的特征图联系起来了?我们提出了一个 reverse connection block 来解决这个问题。 相邻的特征图尺寸差异通过 deconv 反卷积来消除

3.2. Reference Boxes 这里我们对每个尺度的特征图使用 2 scales and 5 aspect ratios 的 default boxes, aspect ratios { 1/3,1/2, 1, 2,3}

3.3. Objectness Prior 针对 正负样本比例严重失调, the ratio between object and non-object samples is seriously imbalanced,这里我们使用 Objectness Prior 来过滤大部分负样本

3.4. Detection and Bounding Box Regression

A=10个 Reference Boxes

inception block 我们使用了一个比较简单的结构

3.5. Combining Objectness Prior with Detection

经过 objectness prior 过滤,只有很少一部分样本进行 back-propagation

4 Training and Testing 4.1. Loss Function 损失函数包括三个子损失函数: objectness prior,矩形框坐标,物体类别

其中α =β =1/3

4.2. Joint Training and Testing Data augmentation :flipped,Randomly sampling a patch

Detection results on PASCAL VOC 2007 test set

Results on PASCAL VOC 2012 test set

MS COCO test-dev2015 detection results

6.1. Do Multiple Layers Help?

low resolution 384×384 input size,With 1.5G GPU memory at test phase, the speed of the network is 15 FPS, 3× faster than the Faster R-CNN counterpart

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

深度学习目标检测指南:如何过滤不感兴趣的分类及添加新分类?

AI 科技大本营按:本文编译自 Adrian Rosebrock 发表在 PyImageSearch 上的一篇博文。该博文缘起于一位网友向原作者请教的两个关于目...

802
来自专栏Petrichor的专栏

深度学习: 目标检测算法 效果对比

使用selective search方法先产生region proposals,再使用浅层CNN网络进行特征提取,最后使用svm进行分类。这篇论文里提及的一个点...

1434
来自专栏Petrichor的专栏

深度学习: smooth L1 loss 计算

RPN的目标函数是分类和回归损失的和,分类采用 交叉熵,回归采用稳定的 Smooth L1,

944
来自专栏大数据智能实战

基于DeepStream的CNN的可视化理解

  对CNN进行可视化是一项重要的工作,有助于理解深度学习模型的黑箱里面到底是什么东西。 有个著名的工具是:deep-visualization-toolbox...

2276
来自专栏梦里茶室

读论文系列:Object Detection ICCV2015 Fast RCNN

Fast RCNN是对RCNN的性能优化版本,在VGG16上,Fast R-CNN训练速度是RCNN的9倍, 测试速度是RCNN213倍;训练速度是SPP-ne...

3276
来自专栏机器学习、深度学习

网络模型--Squeeze-and-Excitation Networks

Squeeze-and-Excitation Networks https://arxiv.org/abs/1709.01507 ILSVRC 2017 i...

1796
来自专栏机器学习算法全栈工程师

Object Detection系列(三) Fast R-CNN

作者:张 旭 编辑:黄俊嘉 ? 该内容是目标检测系列的第三篇,系列前部分内容如下,点击可查看: Object Detection系列(一) R-CNN O...

3187
来自专栏深度学习那些事儿

深度学习中IU、IoU(Intersection over Union)的概念理解以及python程序实现

Intersection over Union是一种测量在特定数据集中检测相应物体准确度的一个标准。我们可以在很多物体检测挑战中,例如PASCAL VOC ch...

1943
来自专栏刘笑江的专栏

Activation

1126
来自专栏机器之心

专栏 | 9 篇顶会论文解读推荐中的序列化建模:Session-based Neural Recommendation

4489

扫码关注云+社区