[计算机视觉论文速递] ECCV 2018 专场10

OK!计算机视觉论文速递系列正式重启,CVer将两/三天更新一次速递推文,如果时间充足,会做到每日一更。

Amusi回来了!

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

ECCV 2018是计算机视觉领域中的顶级会议,目前已经公开了部分已录用的paper。CVer 已经推送了9篇 ECCV 2018论文速递推文:

[计算机视觉论文速递] ECCV 2018 专场1

[计算机视觉论文速递] ECCV 2018 专场2

[计算机视觉论文速递] ECCV 2018 专场3

[计算机视觉论文速递] ECCV 2018 专场4

[计算机视觉论文速递] ECCV 2018 专场5

[计算机视觉论文速递] ECCV 2018 专场6

[计算机视觉论文速递] ECCV 2018 专场7

[计算机视觉论文速递] ECCV 2018 专场8

[计算机视觉论文速递] ECCV 2018 专场9

Object Detection

本文介绍两篇Amusi很喜欢的目标检测论文,下面会推出这两篇论文的精读解析,敬请期待!

《DetNet: A Backbone network for Object Detection》

ECCV 2018

摘要:最近的基于CNN的物体探测器,无论是像YOLO,SSD和RetinaNet这样的one-stage方法,还是像Faster R-CNN,R-FCN和FPN这样的two-stage探测器,都经常试图直接从ImageNet预先训练好的图像模型中进行微调分类。关于专门为物体检测设计的 backbone 特征提取器的讨论很少。更重要的是,图像分类和对象检测的任务之间存在若干差异。(1)最近的物体探测器如FPN和RetinaNet通常涉及额外的阶段,以防止图像分类的任务处理各种尺度的物体。 (2)目标检测不仅需要识别对象实例的类别,还需要在空间上定位位置。较大的下采样因子带来了较大的有效感受野,有利于图像分类,但会损害对象定位能力。由于图像分类和物体检测之间存在差距,本文提出了DetNet,这是一种专门用于物体检测的新型 backbone 网络。此外,DetNet还包括针对传统backbone网络的额外阶段,用于图像分类,同时在更深层中保持高空间分辨率。在没有任何其它tricks的情况下,基于我们的DetNet~(4.8G FLOP)backbone,在MSCOCO基准测试中获得了目标检测和实例分割的最优结果。

arXiv:https://arxiv.org/abs/1804.06215

注:源码还未放出

《Acquisition of Localization Confidence for Accurate Object Detection》

ECCV 2018

IoU-Net architecture

Illustration of RoI Pooling, RoI Align and PrRoI Pooling

摘要:现代的基于CNN的物体检测器依靠边界框回归和非最大抑制(NMS)来定位对象。 虽然类标签的概率自然反映了分类置信度(classification confidence),但缺乏定位置信度(localization confidence)。 这使得正确定位的边界框在迭代回归期间 degenerate 或甚至在NMS期间被抑制。 在本文中,我们提出了IoU-Net学习来预测每个检测到的边界框与匹配的ground truth 之间的IoU。 网络获得了定位置信度,通过保留精确的定位边界框来改进NMS。 此外,提出了一种基于优化的边界框细化方法,其中将预测的IoU表示为目标。 MS-COCO数据集上的大量实验表明了IoU-Net的有效性,以及它与几种最先进的物体探测器的兼容性和适应性。

arXiv:https://arxiv.org/abs/1807.11590

注:源码还未放出

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-10-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏语言、知识与人工智能

IJCAI 2018 | 腾讯知文等提出新型总结式摘要模型:结合主题信息和强化学习训练生成更优摘要

34260
来自专栏机器之心

IJCAI 2018 | 腾讯知文等提出新型生成式摘要模型:结合主题信息和强化训练生成更优摘要

26930
来自专栏机器之心

学界 | 马里兰大学论文:训练深度神经网络中的一致性难题

36450
来自专栏目标检测和深度学习

不使用残差连接,ICML新研究靠初始化训练上万层标准CNN

深度卷积神经网络(CNN)是深度学习成功的关键。基于 CNN 的架构在计算机视觉、语音识别、自然语言处理以及最近的围棋博弈等多个领域取得了前所未有的准确率。

13720
来自专栏新智元

【实战】GAN网络图像翻译机:图像复原、模糊变清晰、素描变彩图

【新智元导读】本文介绍深度学习方法在图像翻译领域的应用,通过实现一个编码解码“图像翻译机”进行图像的清晰化处理,展示深度学习应用在图像翻译领域的效果。 近年来深...

1K30
来自专栏人工智能LeadAI

Mask R-CNN

Mask R-CNN是何凯明大神最近的新作。Mask R-CNN是一种在有效检测目标的同时输出高质量的实例分割mask。是对faster r-cnn的扩展,与b...

45150
来自专栏机器学习算法与Python学习

基础 | 10幅图解释机器学习中的基本概念

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 以下的几幅图是我认为在解释机器学习基...

33660
来自专栏AI科技大本营的专栏

苹果机器学习博客解读CVPR论文:通过对抗训练从模拟的和无监督的图像中学习

? 苹果公司通过试验证明,使用细化后的图像进行训练可以大幅提高多种机器学习任务中模型的准确度。为了克服这种缺陷,他们制定了一种细化合成图像的方法,用以提高图像...

35190
来自专栏一名叫大蕉的程序员

卷积神经网络CNN的各个层做的事情No.30

我是小蕉。 今天跟大家聊聊卷积神经网络各个层实际做的事情以及原理。 马老大在一个峰会说:"我们之前做了很多算法的优化,但是现在有了深度学习,可能用一个算法,不断...

303100
来自专栏机器之心

不使用残差连接,ICML新研究靠初始化训练上万层标准CNN

深度卷积神经网络(CNN)是深度学习成功的关键。基于 CNN 的架构在计算机视觉、语音识别、自然语言处理以及最近的围棋博弈等多个领域取得了前所未有的准确率。

13100

扫码关注云+社区

领取腾讯云代金券