[计算机视觉论文速递] ECCV 2018 专场2

前戏

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

如果说在AI届或者CV圈,现在议论什么的最多,莫过于ICML 2018、IJCAI 2018和ACL 2018。但本文并不会介绍这里的文章,而是介绍将于2018年9月召开的ECCV 2018的部分paper。ECCV 2018是计算机视觉领域中的顶级会议,目前已经公开了部分已录用的paper。之前已经推送了第一篇ECCV 2018论文速递推文:[计算机视觉论文速递] 2018-07-19 ECCV 2018专场1

CNN

《CBAM: Convolutional Block Attention Module》

ECCV 2018

The overview of CBAM

Diagram of each attention sub-module

CBAM integrated with a ResBlock in ResNet

Abstract:我们提出了卷积块注意力模块(CBAM,Convolutional Block Attention Module ),这是一种用于前馈卷积神经网络的简单而有效的注意力(attention)模块。给定中间特征图,我们的模块沿着两个单独的维度(通道和空间)顺序地(sequentially)推断注意力图,然后将注意力图乘以输入特征图以进行自适应特征细化。由于CBAM是一个轻量级的通用模块,它可以无缝地集成到任何CNN架构中,代价可以忽略不计,并且可以与基本CNN一起进行端到端的训练。 我们通过对ImageNet-1K,MS~COCO检测和VOC~2007检测数据集的大量实验来验证我们的CBAM。 我们的实验表明,各种模型在分类和检测性能方面均有一定的改进,证明了CBAM的广泛适用性。 代码和模型将随后公开提供。

arXiv:https://arxiv.org/abs/1807.06521

注:很棒的论文,相信可以帮助一波同学写论文(划水)

Multi-View Reconstruction

《Specular-to-Diffuse Translation for Multi-View Reconstruction》

ECCV 2018

Specular-to-diffuse translation of multi-view images

Overview of S2Dnet

Illustration of the generator and discriminator network

Abstract:大多数多视图3D重建算法,特别是当使用来自阴影的形状提示时,假设对象外观主要是漫射的(predominantly diffuse)。为了缓解这种限制,我们引入了S2Dnet,一种生成的对抗网络,用于将具有镜面反射的物体的多个视图转换为漫反射( diffuse),从而可以更有效地应用多视图重建方法。我们的网络将无监督的图像到图像转换扩展到多视图“镜面到漫反射”的转换。为了在多个视图中保留对象外观,我们引入了一个多视图一致性损失(MVC,Multi-View Coherence loss),用于评估视图转换后局部patches的相似性和faithfulness。我们的MVC损失确保在图像到图像转换下保留多视图图像之间的局部对应的相似性。因此,与几种单视图 baseline 技术相比,我们的网络产生了明显更好的结果。此外,我们使用基于物理的渲染精心设计并生成大型综合训练数据集。在测试过程中,我们的网络仅将原始光泽图像作为输入,无需额外信息,如分割掩模或光照估计。结果表明,使用我们的网络过滤的图像可以显著地改善多视图重建。我们还展示了在现实世界训练和测试数据上的出色表现。

arXiv:https://arxiv.org/abs/1807.05439

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-07-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI启蒙研究院

【通俗理解】协方差

13620
来自专栏阮一峰的网络日志

相似图片搜索的原理

上个月,Google把"相似图片搜索"正式放上了首页。 你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。 ? 一个对话框会出现。 ?...

56370
来自专栏大数据挖掘DT机器学习

用libsvm进行回归预测

作者:kongmeng http://www.cnblogs.com/hdu-2010/p 最近因工作需要,学习了台湾大学林智仁(Lin Chih-Jen)教授...

60170
来自专栏YoungGy

ISLR_t统计量

回顾 t分布的起源 t分布概述 inference for a mean inference for comparing two independent mea...

26850
来自专栏人工智能

使用TensorFlow自动识别验证码(三)

先知安全技术社区独家发表本文,如需要转载,请先联系先知案件技术社区授权;未经授权请勿转载。 0X000 前言 这是该 系列的第三篇文章, 本系列最后一篇。前面几...

29670
来自专栏Petrichor的专栏

深度学习: 从 Selective Search 到 RPN

具体参见我的另一篇博客:Selective Search (选择搜索),简而言之就是,Selective Search 太low太低效。

33640
来自专栏IT技术精选文摘

机器学习在启动耗时测试中的应用及模型调优(一)

启动耗时自动化方案在关键帧识别时,常规的图像对比准确率很低。本文详细介绍了采用scikit-learn图片分类算法在启动耗时应用下的模型调优过程。在之后的续篇中...

18740
来自专栏灯塔大数据

塔趣 | 用深度学习来评判颜值,基于TensorFlow的开源项目FaceRank

导读:用深度学习来评判颜值,已开源。好友 @小灰灰 大大的「颜值评分 FaceRank」,这是基于 TensorFlow 的 CNN 模型,美不美机器说了算。...

428110
来自专栏机器之心

教程 | 基于Keras的LSTM多变量时间序列预测

51980
来自专栏AI科技大本营的专栏

900万张标注图像,谷歌发布Open Images最新V3版

翻译 | Shawn 过去几年机器学习的发展使得计算机视觉有了快速的进步,系统能够自动描述图片,对共享的图片创造自然语言回应。其中大部分的进展都可归因于 Ima...

44270

扫码关注云+社区

领取腾讯云代金券