目标检测--RON: Reverse Connection with Objectness Prior Networks for Object Detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection CVPR2017 https://github.com/taokong/RON

本文可以看作是对 SSD 的改进, SSD 对不同尺度特征图进行独立的检测,这里我们 reverse connection block 将相邻的特征图联系起来。同时使用 objectness prior 来有效降低目标的搜索空间。

3 Network Architecture 我们使用 VGG16 作为基础模型, VGG16有13个卷积层,3个全连接层,这里我们将 第 14,15 全连接层变为卷积层,使用一个2×2卷积核 步长为2 来降采样 FC7 的尺寸。用于检测的特征图尺寸分布为输入图像尺寸的 1/8 (conv 4 3), 1/16 (conv 5 3), 1/32 (conv 6) and 1/64 (conv 7)

RON object detection overview

3.1. Reverse Connection 怎么把相邻的特征图联系起来了?我们提出了一个 reverse connection block 来解决这个问题。 相邻的特征图尺寸差异通过 deconv 反卷积来消除

3.2. Reference Boxes 这里我们对每个尺度的特征图使用 2 scales and 5 aspect ratios 的 default boxes, aspect ratios { 1/3,1/2, 1, 2,3}

3.3. Objectness Prior 针对 正负样本比例严重失调, the ratio between object and non-object samples is seriously imbalanced,这里我们使用 Objectness Prior 来过滤大部分负样本

3.4. Detection and Bounding Box Regression

A=10个 Reference Boxes

inception block 我们使用了一个比较简单的结构

3.5. Combining Objectness Prior with Detection

经过 objectness prior 过滤,只有很少一部分样本进行 back-propagation

4 Training and Testing 4.1. Loss Function 损失函数包括三个子损失函数: objectness prior,矩形框坐标,物体类别

其中α =β =1/3

4.2. Joint Training and Testing Data augmentation :flipped,Randomly sampling a patch

Detection results on PASCAL VOC 2007 test set

Results on PASCAL VOC 2012 test set

MS COCO test-dev2015 detection results

6.1. Do Multiple Layers Help?

low resolution 384×384 input size,With 1.5G GPU memory at test phase, the speed of the network is 15 FPS, 3× faster than the Faster R-CNN counterpart

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习那些事儿

利用pytorch实现神经网络风格迁移Neural Transfer

载入图像输入大小无要求,最终会被剪裁到相同大小,这是因为神经网络设计了一个特定的输入大小,因此内容图像和风格图像必须大小一致。

37170
来自专栏Bingo的深度学习杂货店

使用Keras实现生成式对抗网络GAN

生成式对抗网络(GAN)自2014年提出以来已经成为最受欢迎的生成模型。本文借鉴机器之心对 2014 GAN 论文的解读,在本机运行该Keras项目。 传送门:...

80740
来自专栏机器学习算法工程师

《机器学习实战》学习笔记(十一):线性回归基础篇之预测鲍鱼年龄

作者:崔加华 编辑:祝鑫泉 前言 1 好久没有更新了,最近中耳炎,晚上耳鸣,一度影响正常工作,慢慢吃药调理中。在学习之余,记得加强体育锻炼! 前面的文章介绍了很...

82050
来自专栏量化投资与机器学习

深度学习Matlab工具箱代码注释之cnnbp.m

%%========================================================================= %...

23750
来自专栏贾志刚-OpenCV学堂

使用OpenCV与sklearn实现基于词袋模型(Bag of Word)的图像分类预测与搜索

基于OpenCV实现SIFT特征提取与BOW(Bag of Word)生成向量数据,然后使用sklearn的线性SVM分类器训练模型,实现图像分类预测。实现基于...

59330
来自专栏深度学习那些事儿

利用pytorch实现神经网络风格迁移Neural Transfer

载入图像输入大小无要求,最终会被剪裁到相同大小,这是因为神经网络设计了一个特定的输入大小,因此内容图像和风格图像必须大小一致。

47820
来自专栏人工智能

深入机器学习系列12-高斯混合模型

高斯混合模型   现有的高斯模型有单高斯模型()和高斯混合模型()两种。从几何上讲,单高斯分布模型在二维空间上近似于椭圆,在三维空间上近似于椭球。在很多情况下,...

25790
来自专栏机器学习算法工程师

干货|(DL~2)一看就懂的卷积神经网络

文章来自:https://leonardoaraujosantos.gitbooks.io 作者:Leonardo Araujo dos Santos

12110
来自专栏Pytorch实践

Pytorch实现Logistic回归二分类

? 摘要:本文主要介绍使用深度学习框架Pytorch实现简单的Logistic回归模型,进而实现简单的分类问题。 一.逻辑回归简述 逻辑回归实质上是线性回...

1.4K140
来自专栏机器学习、深度学习

统计学习导论 Chapter5 -- Resampling Methods

Book: An Introduction to Statistical Learning with Applications in R http:...

27160

扫码关注云+社区

领取腾讯云代金券