目标检测--RON: Reverse Connection with Objectness Prior Networks for Object Detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection CVPR2017 https://github.com/taokong/RON

本文可以看作是对 SSD 的改进, SSD 对不同尺度特征图进行独立的检测,这里我们 reverse connection block 将相邻的特征图联系起来。同时使用 objectness prior 来有效降低目标的搜索空间。

3 Network Architecture 我们使用 VGG16 作为基础模型, VGG16有13个卷积层,3个全连接层,这里我们将 第 14,15 全连接层变为卷积层,使用一个2×2卷积核 步长为2 来降采样 FC7 的尺寸。用于检测的特征图尺寸分布为输入图像尺寸的 1/8 (conv 4 3), 1/16 (conv 5 3), 1/32 (conv 6) and 1/64 (conv 7)

RON object detection overview

3.1. Reverse Connection 怎么把相邻的特征图联系起来了?我们提出了一个 reverse connection block 来解决这个问题。 相邻的特征图尺寸差异通过 deconv 反卷积来消除

3.2. Reference Boxes 这里我们对每个尺度的特征图使用 2 scales and 5 aspect ratios 的 default boxes, aspect ratios { 1/3,1/2, 1, 2,3}

3.3. Objectness Prior 针对 正负样本比例严重失调, the ratio between object and non-object samples is seriously imbalanced,这里我们使用 Objectness Prior 来过滤大部分负样本

3.4. Detection and Bounding Box Regression

A=10个 Reference Boxes

inception block 我们使用了一个比较简单的结构

3.5. Combining Objectness Prior with Detection

经过 objectness prior 过滤,只有很少一部分样本进行 back-propagation

4 Training and Testing 4.1. Loss Function 损失函数包括三个子损失函数: objectness prior,矩形框坐标,物体类别

其中α =β =1/3

4.2. Joint Training and Testing Data augmentation :flipped,Randomly sampling a patch

Detection results on PASCAL VOC 2007 test set

Results on PASCAL VOC 2012 test set

MS COCO test-dev2015 detection results

6.1. Do Multiple Layers Help?

low resolution 384×384 input size,With 1.5G GPU memory at test phase, the speed of the network is 15 FPS, 3× faster than the Faster R-CNN counterpart

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能

深入机器学习系列12-高斯混合模型

高斯混合模型   现有的高斯模型有单高斯模型()和高斯混合模型()两种。从几何上讲,单高斯分布模型在二维空间上近似于椭圆,在三维空间上近似于椭球。在很多情况下,...

2319
来自专栏红色石头的机器学习之路

台湾大学林轩田机器学习技法课程学习笔记14 -- Radial Basis Function Network

上节课我们主要介绍了Deep Learning的概念。Deep Learing其实是Neural Networ的延伸,神经元更多,网络结构更加复杂。深度学习网络...

2270
来自专栏Bingo的深度学习杂货店

使用Keras实现生成式对抗网络GAN

生成式对抗网络(GAN)自2014年提出以来已经成为最受欢迎的生成模型。本文借鉴机器之心对 2014 GAN 论文的解读,在本机运行该Keras项目。 传送门:...

6184
来自专栏贾志刚-OpenCV学堂

使用OpenCV与sklearn实现基于词袋模型(Bag of Word)的图像分类预测与搜索

基于OpenCV实现SIFT特征提取与BOW(Bag of Word)生成向量数据,然后使用sklearn的线性SVM分类器训练模型,实现图像分类预测。实现基于...

2453
来自专栏技术沉淀

Kmeans算法的Python实现

1453
来自专栏机器学习算法工程师

趣谈深度学习核心----激活函数

作者:詹晓辉 编辑:王抒伟 当你在苦扒图像处理方法得时候 他在用深度学习 当你在干瞪切片像素得时候 他在用深度学习 当你在愁思小偷是谁得时候 他在用深度学习 当...

3587
来自专栏TensorFlow从0到N

【译】TensorFlow实现Batch Normalization

原文:Implementing Batch Normalization in Tensorflow 来源:R2RT 译者注:本文基于一个最基础的全连接...

6826
来自专栏编程

CNN之文本分类之网络结构

本文主要是基于Yoon Kim的Convolutional Neural Networks for Sentence Classification,用中文重新梳...

2236
来自专栏机器学习、深度学习

统计学习导论 Chapter5 -- Resampling Methods

Book: An Introduction to Statistical Learning with Applications in R http:...

2345
来自专栏深度学习那些事儿

利用pytorch实现神经网络风格迁移Neural Transfer

载入图像输入大小无要求,最终会被剪裁到相同大小,这是因为神经网络设计了一个特定的输入大小,因此内容图像和风格图像必须大小一致。

2987

扫码关注云+社区