快速小目标检测--Feature-Fused SSD: Fast Detection for Small Objects

Feature-Fused SSD: Fast Detection for Small Objects

本文针对小目标检测问题,对 SSD 模型进行了一个小的改进,将 contextual information 引入到 SSD 中 帮助SSD检测小目标。

contextual information 对于小目标的检测 重要性是不言而喻的。小目标在图像中 limited resolution and information,只能借助其周边信息了。

Feature-fused SSD architecture

这里主要还是讲不通尺度的特征图信息融合起来。

Which layers to combine? 但是具体融合哪个卷积层的特征图了

Because of SSD predicting small objects with its shallower layers,所以我们不用对应大目标的 deeper layers For choosing the proper feature fusion layers, effective receptive fields in different layers are explored with deconvolution method 对应上图中的小船,SSD中的 conv4_3 对应的 effective receptive field 是最合适的。 其他层的特征都不是很好

shallower layers 具有 contextual information ,但是它们没有 sematic information,deeper layers 具有 sematic information,所以我们需要将这两类信息融合起来。这里我们尝试了两种融合策略。 concatenation module and element-sum module

3.2 Concatenation Module

3.3 Element-Sum Module

4 Experimental Resultis Detection results of different fusion layers

Detection results of different number of kernels

Results on PASCAL VOC2007 test set (with IOU=0.5)

The running time illustration of different models

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

Github 项目推荐 | 用 PyTorch 实现 OpenNMT

这是一个用 PyTorch 实现的 OpenNMT 的库,OpenNMT 是一个神经机器翻译系统。

1354
来自专栏深度学习与数据挖掘实战

【今日热门】优秀资源

592
来自专栏AI科技大本营的专栏

研究 | YOLO一眼就能认出你:看一个神经网络如何全视野实时检测目标

作者 | Joseph Redmon的 & Ali Farhadi 编译|AI100(rgznai100) YOLO全名You only look once(你...

34413
来自专栏AI科技大本营的专栏

Mask R-CNN 源代码终上线,Facebook 开源目标检测平台—Detectron

Example Mask R-CNN output Facebook AI 研究院(FAIR)昨日开源了一款目标检测平台—Detectron,基于Python和...

4168
来自专栏专知

Github上一些精致且实用的TensorFlow项目及相关论文

【导读】Github上有许多成熟的TensorFlow代码和模型,可以直接用于科研和工程中。本文会介绍其中一些与自动问答、机器翻译、风格转换等相关的精致且实用的...

1103
来自专栏CVer

GitHub:目标检测最全论文集锦

目标检测(Object Detection)可以识别一幅图像中的多个物体,定位不同物体的同时(边界框),贴上相应的类别。简单来说,解决了what和where问题...

3262
来自专栏CVer

[计算机视觉论文速递] 2018-07-07 CVPR 图像分割专场1

这篇文章有 2篇论文速递,都是图像分割方向(CVPR 2018),一篇提出CCB-Cut损失,另一篇是对FCN网络进行了改进。注意,两篇都是CVPR 2018文...

1092
来自专栏AI研习社

可能是最好玩的深度学习模型:CycleGAN的原理与实验详解

CycleGAN是在今年三月底放在arxiv的一篇文章,文章名为Learning to Discover Cross-Domain Relations with...

4914
来自专栏Deep learning进阶路

深度学习论文(十)---Multiple-Human Parsing in the Wild

Towards Real World Human Parsing: Multiple-Human Parsing in the Wild J Li , J ...

4020
来自专栏编程

Mask R-CNN 源代码终上线,Facebook 开源目标检测平台—Detectron

Example Mask R-CNN output Facebook AI 研究院(FAIR)昨日开源了一款目标检测平台—Detectron,基于Python和...

3878

扫码关注云+社区