前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >目标检测--Wide-Residual-Inception Networks for Real-time Object Detection

目标检测--Wide-Residual-Inception Networks for Real-time Object Detection

作者头像
用户1148525
发布2019-05-26 12:18:52
4050
发布2019-05-26 12:18:52
举报

本文主要是在 Residual 和 Inception 基础上构建新的模型,实现实时物体检测。构建的新模型特色是占用内存少,计算量小。新网络命名为 wide-residual-inception (WR-Inception) 。

III. Wide-Residual-Inception Networks

A. Factors to Consider in Neural Network Modeling—Width vs. Depth 文献【29】实验声称一个网络主要受三个因素影响:深度、宽度、滤波器尺寸。当时间复杂度固定,通过改变上面三个因素时,发现改变深度能最大的提升网络的性能。 文献【9】中的 wide-residual 宽残差网络证明通过残差网络中的 shortcut 链接,一个宽的浅层网络模型比 ResNets 效果要好。 本文主要针对嵌入式环境,结合前面两个文献的结论,提出了一个新模型,在一个大模型中重复使用一个小的模块。

B. Micro-Architecture • Basic residual (3x3,3x3): 将两个3x3卷积层串联起来,再外加一个 shortcut • Bottleneck (1x1, 3x3, 1x1): 首先用一个 1x1 卷积进行特征降维,再进行3x3卷积,最后再用 1x1恢复到原来的尺寸,外加一个 shortcut

• Inception: 该模块是 GoogleNet 中提出的,在同一个特征层上使用了不同种类的卷积,1x1, 3x3, 和 5x5,这么做可以提取不同尺度的目标特征。

这里写图片描述
这里写图片描述

C. Residual Inception Unit 上图 c 中显示的是 residual-inception 模块,它对 inception 模块加了一个 shortcut,首先进行 1x1 卷积,再分叉进行 3x3, 和 5x5 卷积,而不是对每个路线进行 1x1 卷积。这里 5x5 卷积 是用两个3x3卷积来表示的。最后使用 concatenation 将这些组合起来。效果如下图所示:

这里写图片描述
这里写图片描述

D. Macro-Architecture

这里写图片描述
这里写图片描述

上面三个网络的计算量大致一样,但是网络性能不一样。

这里使用 a Single-Shot Multi-box Detector (SSD) 这个框架来论证上面模型的效果。可以检测不同尺寸物体。

这里写图片描述
这里写图片描述

计算量对比图:

这里写图片描述
这里写图片描述

效果:

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年02月22日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档