目标检测-- DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling

DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling ICCV2017 An easily extendedTheanobased code: https://github.com/lachlants/denet

本文针对候选区域提取这个步骤进行加速: 使用角点提取来初步过滤大部分候选区域

我们提出的 DeNet 网络

1.2. Probabilistic Object Detection 这里对候选区域提取这个步骤使用了一些符号表示方法来描述, 可能的候选区域位置有很多,计算量很大。 所以在损失一定定位精度的情况下, subsampling the output bounding boxes 是一个合理的选择,例如 Faster R-CNN and YOLO 大概采样了一万到十万个 bounding boxs

2 Directed Sparse Sampling (DSS) 2.1. Corner-based RoI Detector 估计每个位置是否是 4 corner types 中的一个, Pr(t|k,y,x) ,其中 t 是一个二值变量, indicating the presence of a corner of type k ∈ { top left,top right,bottom left,bottom right } at position (x,y) in the input image

因为问题中天然的平移不变性,可以使用一个 标准的CNN网络来快速有效的进行角点分布估计,这个CNN可以在 有矩形框标记的数据上训练。

有了 corner distribution 之后,我们使用一个 Naive Bayesian Classifier 来确定每个角点对应得矩形框内是否包含物体

对于含有物体的矩形框,我们对矩形框相对固定位置进行采样,得到一个固定长度的 feature vector ,我们使用这个向量输入分类器,得到最终结果:该矩形框是否包含物体。 It is important that the feature is uniquely associated with each bounding box 特征是独一无二的 uniquely

2.2. Training 我们的损失函数定义如下: corner probability distribution, final classification distribution and bounding box regression cost

2.3. Detection Model 这里我们使用了 Residual neural networks 作为基础模型,一个34层,一个是 101层。 As the base model to our networks we selected the 34 layer, 21M parameter ResNet-34 model (DeNet-34) and the 101 layer, 45M parameter ResNet-101 model (DeNet-101)

我们的输入图像尺寸是 512*512,去掉最后的均值池化和全连接层,在角点检测器后面加了两个反卷积层。 corner detector 用于生成 corner distribution,通过一个 learnt linear projection 生成一个 feature sampling map。 反卷积层主要用于放大特征图尺寸。

corner detector 之后是 sparse layer,通过观察角点生成 一组 bounding boxes 。然后我们在这些矩形框里对应的 feature sampling map 采样,得到一个长度为 7 × 7 × F s + 2 的特征向量,该向量输入 a relatively shallow fully connected network 得到最终结果: generate the final classification and fine tuned bounding box for each sampling RoI

2.3.1 Skip Layer Variant 加了一些 Skip Layer 改进

2.3.2 Wide Variant 用了更大的特征图尺寸,采样了更多的位置

3.2. Identifying Sampling Bounding Boxes (RoIs) 角点分布的快速搜索如下:

4 Results and Analysis

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SeanCheney的专栏

《Scikit-Learn与TensorFlow机器学习实用指南》 第06章 决策树

和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务, 甚至包括多输出(multioutput)任务.

1042
来自专栏AI科技大本营的专栏

经典重读 | 深度学习方法:卷积神经网络结构变化——Spatial Transformer Networks

作者 | 大饼博士X 本文具体介绍Google DeepMind在15年提出的Spatial Transformer Networks,相当于在传统的一层Co...

35311
来自专栏小小挖掘机

推荐系统遇上深度学习(十六)--详解推荐系统中的常用评测指标

最近阅读论文的过程中,发现推荐系统中的评价指标真的是五花八门,今天我们就来系统的总结一下,这些指标有的适用于二分类问题,有的适用于对推荐列表topk的评价。

862
来自专栏YoungGy

浅谈小波分析

小波的发展历史与驱动 傅里叶变换 短时傅里叶变换 小波变换 傅里叶变换 小波变换 三种变换的对比 小波变换 离散小波变换 连续小波变换 小波的多分辨率阐述 信号...

3849
来自专栏机器之心

教程 | 一文简述多种无监督聚类算法的Python实现

1874
来自专栏marsggbo

论文笔记系列-Neural Architecture Search With Reinforcement Learning

神经网络在多个领域都取得了不错的成绩,但是神经网络的合理设计却是比较困难的。在本篇论文中,作者使用 递归网络去省城神经网络的模型描述,并且使用 增强学习训练RN...

1603
来自专栏计算机视觉战队

DeepLab v2及调试过程

今天我们开始说说语义分割第二个系列,DeepLab V2。说这个之前,我们先说说FCN的一些简单知识。 图像语义分割,简单而言就是给定一张图片,对图片上的每一个...

3706
来自专栏一棹烟波

Harris角点检测原理分析

看到一篇从数学意义上讲解Harris角点检测很透彻的文章,转载自:http://blog.csdn.net/newthinker_wei/article/det...

1130
来自专栏机器学习算法全栈工程师

目标检测算法之SSD

作者:叶 虎 编辑:祝鑫泉 前言 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型:(1)two-stage方法,如R-CNN系算法,其主...

5.1K7
来自专栏深度学习计算机视觉

【人脸检测】Compact Cascade CNN和MTCNN算法

【文章导读】目前人脸识别技术已经遍地开花,火车站、机场、会议签到等等领域都有应用,人脸识别的过程中有个重要的环节叫做人脸检测,顾名思义就是在一张图片中找出所有的...

1521

扫码关注云+社区