[计算机视觉论文速递] ECCV 2018 专场11

前戏

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

ECCV 2018是计算机视觉领域中的顶级会议,目前已经公开了部分已录用的paper。CVer 已经推送了9篇 ECCV 2018论文速递推文:

[计算机视觉论文速递] ECCV 2018 专场1

[计算机视觉论文速递] ECCV 2018 专场2

[计算机视觉论文速递] ECCV 2018 专场3

[计算机视觉论文速递] ECCV 2018 专场4

[计算机视觉论文速递] ECCV 2018 专场5

[计算机视觉论文速递] ECCV 2018 专场6

[计算机视觉论文速递] ECCV 2018 专场7

[计算机视觉论文速递] ECCV 2018 专场8

[计算机视觉论文速递] ECCV 2018 专场9

[计算机视觉论文速递] ECCV 2018 专场10

Semantic Segmentation

本文介绍两篇Amusi很喜欢的语义分割(Semantic Segmentation)论文。

《BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation》

ECCV 2018

Illustration of the architectures to speed up and our proposed approach

An overview of the Bilateral Segmentation Network.

摘要:语义分割(semantic segmentation)需要丰富的空间信息和相当大的感受野(receptive field)。但是,现代方法通常会牺牲空间分辨率(spatial resolution)来实现实时inference速度,从而导致性能不佳。在本文中,我们通过一种新颖的双边分割网络(Bilateral Segmentation Network,BiSeNet)来解决这一难题。我们首先设计一个小步幅的 Spatial Path,以保留空间信息并生成高分辨率特征。同时,采用具有快速下采样策略的 Context Path 来获得足够的感受野。在这两条 path 的顶部,我们引入了一个新的特征融合模块(Feature Fusion Module),以有效地结合特征。所提出的BiSeNet框架在Cityscapes,CamVid和COCO-Stuff数据集上的速度和分割性能之间取得了适当的平衡。具体来说,对于2048x1024输入,我们在Cityscapes测试数据集上实现了68.4%的Mean IOU,在一块NVIDIA Titan XP卡上的速度为105 FPS,这明显快于当前其它可比的方法。

arXiv:http://arxiv.org/abs/1808.00897

注:源码还未放出

《Unsupervised Domain Adaptation for Semantic Segmentation via Class-Balanced Self-Training》

ECCV 2018

Illustration of the proposed itertive self-training framework for unsupervised domain adaptation. Left: algorithm workflow. Right figure: semantic segmentation results on Cityscapes before and after adaptation

摘要:最近的深度网络在各种语义分割任务上实现了最先进的性能。尽管取得了这些进展,但这些模型经常面临现实世界“wild tasks”中的挑战,其中存在标记的训练/源数据与看不见的测试/目标数据之间的巨大差异。特别地,这种差异通常被称为“domain gap”,并且可能导致显著的性能降低。这并不能通过进一步增加表示能力而容易地补救。无监督域适应(Unsupervised Domain Adaptation,UDA)试图在没有目标域标签的情况下克服这种问题。在本文中,我们提出了一种基于迭代自训练(Self-training,ST)过程的新型UDA框架,其中该问题被公式化为潜在变量损失最小化,并且可以通过在目标数据上交替生成伪标签(pseudo labels)并重新训练来解决。带有这些标签的模型。在ST之上,我们还提出了一种新颖的类平衡自我训练(Class Balanced Self-training,CBST)框架,avoid the gradual dominance of large classes on pseudo-label generation,并引入空间先验(spatial prior)来细化生成的标签。综合实验表明,所提出的方法在多个主要UDA设置下实现了最先进的语义分割性能。

paper:

http://openaccess.thecvf.com/content_ECCV_2018/papers/Yang_Zou_Unsupervised_Domain_Adaptation_ECCV_2018_paper.pdf

注:源码还未放出

希望上述两篇ECCV 2018 最新的paper可以给你带来一点灵感~

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-10-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数说工作室

【分类战车SVM】第二话:线性分类

分类战车SVM (第二话:线性分类) 回复“SVM”查看本《分类战车SVM》系列的内容: 第一话:开题话 第二话:线性分类 第三话:最大间隔分类器 第四话:拉格...

449110
来自专栏SIGAI学习与实践平台

OCR技术简介

光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图...

3.9K10
来自专栏机器之心

ICML 2018 | MILA提出防御增强型网络:简单修改已有网络即可提升防攻击能力

选自arXiv 作者:Alex Lamb, Jonathan Binas, Anirudh Goyal, Dmitriy Serdyuk, Sandeep Su...

33050
来自专栏CDA数据分析师

【技术】SPSS因子分析

因子分析在各行各业的应用非常广泛,尤其是科研论文中因子分析更是频频出现。小兵也凑个热闹,参考《SPSS统计分析》书中的案例,运用SPSS进行因子分析,作为我博客...

31790
来自专栏AI科技大本营的专栏

详解 | Dropout为何能防止过拟合?

开篇明义,dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,...

37230
来自专栏闪电gogogo的专栏

像素级压缩感知图像融合的论文

2012 基于压缩感知理论的图像融合方法 ? 不同的是在测量前先对稀疏矩阵进行融合,从仿真结果来看效果并不是很好,仅做介绍。 2012 一种基于小波稀疏基的压缩...

33870
来自专栏AI研习社

详解基于朴素贝叶斯的情感分析及Python实现

相对于「 基于词典的分析 」,「 基于机器学习 」的就不需要大量标注的词典,但是需要大量标记的数据,比如: 还是下面这句话,如果它的标签是: 服务质量 - 中 ...

43680
来自专栏人工智能头条

Yoshua Bengio:在能量模型中使用提前推断近似反向传播

17520
来自专栏大数据互联网思维

HDR关键技术:逆色调映射

HDR技术近年来发展迅猛,在未来将会成为图像与视频领域的主流。当前HDR内容非常短缺,限制了HDR视听节目的广泛应用。逆色调映射(Inverse Tone Ma...

26900
来自专栏数说工作室

【分类战车SVM】第二话:线性分类

分类战车SVM (第二话:线性分类) 1. 回顾 上一集我们大致介绍了机器学习世界的一种新武器——支持向量机,代号为SVM(微信公众号“数说工作室”中回复“SV...

41950

扫码关注云+社区

领取腾讯云代金券