前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[计算机视觉论文速递] 2018-06-08

[计算机视觉论文速递] 2018-06-08

作者头像
Amusi
发布2018-07-24 11:13:26
6810
发布2018-07-24 11:13:26
举报
文章被收录于专栏:CVerCVer

导言

这篇文章有4篇论文速递信息,涉及胶囊网络、迁移学习、优化CNN和手指检测等方向(含一篇NIPS 2017、一篇ICMR 2018和一篇 VCIP 2017)。

编辑: Amusi

校稿: Amusi

前戏

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

直接点击“阅读全文”即可访问daily-paper-computer-vision

link: https://github.com/amusi/daily-paper-computer-vision

Capusle Networks & Transfer Learning

《Capsule networks for low-data transfer learning》

arXiv 2018

The full memo architecture

Abstract:我们提出了一个基于胶囊网络(capsule network)的框架,用于通过少数例子将学习推广到新数据。使用生成(generative)和非生成胶囊网络与中间路由(intermediate routing),我们能够生成比相似卷积神经网络快25倍的新信息。我们在缺少一位数字的multiMNIST数据集上训练网络。在网络达到其最大精度后,我们将1-100个缺失数字的样本放入训练集,并测量返回到可比较的准确度所需的批次数。然后我们讨论胶囊网络带来的低数据传输学习的改进,并为胶囊网络研究提出未来的发展方向。

arXiv:https://arxiv.org/abs/1804.10172

注:最近感觉Capsule Network不是很火了~

CNN

《Competitive Learning Enriches Learning Representation and Accelerates the Fine-tuning of CNNs》

NIPS 2017

(a) Network structure of a simple CNN

(b) BP learning of conventional CNN (control condition).

(c)Competitive learning.

Abstract:在这项研究中,我们提出将竞争性学习整合到卷积神经网络(CNN)中以改善表示学习和微调(fine-tuning)效率。传统的CNN使用反向传播学习,它可以通过区分任务实现强大的表示学习。但是,它需要大量标记数据,并且标记数据的获取比未标记数据的难得多。因此,有效使用未标记的数据对于DNN越来越重要。为了解决这个问题,我们将无监督的竞争学习引入卷积层,并利用未标记的数据进行有效的表示学习。使用玩具(toy)模型的验证实验的结果表明,强表示(strong representation )学习使用未标记的数据有效地将图像的基础提取到卷积滤波器中,并且加快了后续监督的反向传播学习的微调的速度。当滤波器数量足够大时,杠杆作用更明显,并且在这种情况下,在微调的初始阶段误差率急剧下降。因此,所提出的方法扩大了CNN中的滤波器的数量,并且使得更加详细和通用的表示。它不仅可以提供一个深层广泛的神经网络的可能性。

arXiv:https://arxiv.org/abs/1804.09859

Visual Estimation

《Visual Estimation of Building Condition with Patch-level ConvNets》

ICMR 2018

Visual appearance of the building elements roof (top row), facade (middle row), and window (bottom row) for the conditions very good, good, and poor.

Abstract:建筑物的状况(condition)是房地产估价的重要因素。目前,房地产估价师对房地产估价具有一定的主观性。我们提出了一种新颖的基于视觉的方法,用于从建筑物的外部视图评估建筑物状况。为此,我们开发了一种多尺度基于patch模式的提取方法,并将其与卷积神经网络相结合,从视觉线索估计建筑物状况。我们的评估显示,视觉估计的建筑条件可以作为评估师对状况估计的proxy。

arXiv:https://arxiv.org/abs/1804.10113

Finger Detection

《Two-Stream Binocular Network: Accurate Near Field Finger Detection Based On Binocular Images》

VCIP 2017

The pipeline of TSBnet

Abstract:指尖检测(Fingertip )在人机交互中起着重要作用。先前的工作是将双目(binocular)图像转换为深度图像。 然后使用基于深度的手姿势估计方法来预测指尖的三维位置。与以前的工作不同,我们提出了一个新的框架,名为双流双目网络(TSBnet),直接从双目图像中检测指尖。TSBnet首先共享左右图像低级特征的卷积图层。然后分别提取双流卷积网络中的高层特征。此外,我们添加了一个新层:双目距离测量层,以提高我们模型的性能。为了验证我们的方案,我们构建了一个双目手图像数据集,包含训练集中的约117k对图像和测试集中的10k对图像。 我们的方法在我们的测试装置上实现了10.9mm的平均误差,比以前的工作性能要好5.9mm(相对35.1%)。

arXiv:https://arxiv.org/abs/1804.10160

IEEE:https://ieeexplore.ieee.org/abstract/document/8305146/

Datasets:https://sites.google.com/view/thuhand17

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CVer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档