重磅干货,第一时间送达
如果说在AI届或者CV圈,现在议论什么的最多,莫过于ICML 2018、IJCAI 2018和ACL 2018。但本文并不会介绍这里的文章,而是介绍将于2018年9月召开的ECCV 2018的部分paper。ECCV 2018是计算机视觉领域中的顶级会议,目前已经公开了部分已录用的paper。
CNN
《CBAM: Convolutional Block Attention Module》
ECCV 2018
The overview of CBAM
Diagram of each attention sub-module
CBAM integrated with a ResBlock in ResNet
Abstract:我们提出了卷积块注意力模块(CBAM,Convolutional Block Attention Module ),这是一种用于前馈卷积神经网络的简单而有效的注意力(attention)模块。给定中间特征图,我们的模块沿着两个单独的维度(通道和空间)顺序地(sequentially)推断注意力图,然后将注意力图乘以输入特征图以进行自适应特征细化。由于CBAM是一个轻量级的通用模块,它可以无缝地集成到任何CNN架构中,代价可以忽略不计,并且可以与基本CNN一起进行端到端的训练。 我们通过对ImageNet-1K,MS~COCO检测和VOC~2007检测数据集的大量实验来验证我们的CBAM。 我们的实验表明,各种模型在分类和检测性能方面均有一定的改进,证明了CBAM的广泛适用性。 代码和模型将随后公开提供。
arXiv:https://arxiv.org/abs/1807.06521
注:很棒的论文,相信可以帮助一波同学写论文(划水)
Multi-View Reconstruction
《Specular-to-Diffuse Translation for Multi-View Reconstruction》
ECCV 2018
Specular-to-diffuse translation of multi-view images
Overview of S2Dnet
Illustration of the generator and discriminator network
Abstract:大多数多视图3D重建算法,特别是当使用来自阴影的形状提示时,假设对象外观主要是漫射的(predominantly diffuse)。为了缓解这种限制,我们引入了S2Dnet,一种生成的对抗网络,用于将具有镜面反射的物体的多个视图转换为漫反射( diffuse),从而可以更有效地应用多视图重建方法。我们的网络将无监督的图像到图像转换扩展到多视图“镜面到漫反射”的转换。为了在多个视图中保留对象外观,我们引入了一个多视图一致性损失(MVC,Multi-View Coherence loss),用于评估视图转换后局部patches的相似性和faithfulness。我们的MVC损失确保在图像到图像转换下保留多视图图像之间的局部对应的相似性。因此,与几种单视图 baseline 技术相比,我们的网络产生了明显更好的结果。此外,我们使用基于物理的渲染精心设计并生成大型综合训练数据集。在测试过程中,我们的网络仅将原始光泽图像作为输入,无需额外信息,如分割掩模或光照估计。结果表明,使用我们的网络过滤的图像可以显著地改善多视图重建。我们还展示了在现实世界训练和测试数据上的出色表现。
arXiv:https://arxiv.org/abs/1807.05439
领取专属 10元无门槛券
私享最新 技术干货