前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论文阅读: DetNet

论文阅读: DetNet

作者头像
JNingWei
发布2018-09-27 14:50:12
7930
发布2018-09-27 14:50:12
举报
文章被收录于专栏:JNing的专栏JNing的专栏

Introduction

Face++的Li Zeming大神注意到了现有Detection Network的两大通病:

  1. 寄生于原为class task而设计的network,牵强地附加上其他辅助结构(SPP layer/RoI Pooling/RoI Align/Position-sensitive score map)来实现Detection;
  2. 下采样能带来大感受野,从而提升class任务精度;但又会损失空间信息,影响detection精度。二者难以协调。

为此,Li Zeming大神专门设计了Detection专属的DetNet Backbone。结构如下:

这里写图片描述
这里写图片描述

并设计了专属的bottleneck:

这里写图片描述
这里写图片描述

需要注意的是,DetNet本身只是一个backbone,和FPN一样,只是为广大two-stage detector服务的RP供应商。因此它是无法独立存在来完成检测任务的。

Innovation

最大的创新点,其实就是将原本的32X的下采样,用两个16X的卷积来替换。这样既能通过叠加卷积实现感受野的扩张,也避免了因为下采样所导致的位置信息的丢失:

这里写图片描述
这里写图片描述

其实呢,个人感觉这不是什么新东西。YOLO早在16年就有类似的操作了:

这里写图片描述
这里写图片描述

另外是层组件上的改进,设计了一套(A+B)bottleneck组合:

这里写图片描述
这里写图片描述

感觉就是Inception的变种。

Result

刷到了新的state-of-the-art:

这里写图片描述
这里写图片描述

该backbone在分割任务上也同样出众,说明general性能好:

这里写图片描述
这里写图片描述

po出效果图:

这里写图片描述
这里写图片描述

Thinking

  • 这篇文章的创新点和FAIR的 Focal Loss 类似,都是一点点的小改进,但却是涨点的大杀器。
  • 不过我总觉得backbone极似YOLOv1的网络结构。one-stage系的YOLOv1是几个下采样后缩小32X,之后几个连续的同size卷积。DetNet则是下采样到16X就停止了,然后几个连续的同size卷积号称可以在扩大感受野的同时不损失空间信息。 或许是YOLOv1无心插柳,却被DetNet注意到了,并深入挖掘了背后的理论知识吧。
  • 这是第一次专门针对Detection所设计的Network。估计也只有Li Zeming大神有底气用这么霸气的名字了吧。
  • 另外,或许Li Zeming大神可以学习一下He Kaiming大神的写作,对该创新点进行更加高大上的包装。
  • 看论文格式,应该是打算投ECCV。
  • 最后,期待Li Zeming大神的源码发布。

[1] DetNet: A Backbone network for Object Detection

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年04月19日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Introduction
  • Innovation
  • Result
  • Thinking
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档