[计算机视觉论文速递] 2018-02-28

[1]《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》 CVPR 2018

论文提出一种CSRNet网络,用于理解高度拥挤的场景。

arxiv:https://arxiv.org/abs/1802.10062

[2]《Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning》

论文整合预训练、投票和主动学习三种方法来提高早期印刷图书的OCR准确率。

arxiv:https://arxiv.org/abs/1802.10038

github:https://github.com/chreul/OCR_Testdata_EarlyPrintedBooks

[3]《Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks》

论文提出一种CNN和LSTM网络结合来提高OCR在早期印刷图书的准确率。

arxiv:https://arxiv.org/abs/1802.10033

[4]《Generating High Quality Visible Images from SAR Images Using CNNs》

论文提出了一种利用生成对抗性网络 (GAN) 生成合成孔径雷达 (SAR) 图像的高品质可见光图像的新方法。所提出的方法是基于CNNs的去斑和图像着色。级联结构在训练过程中的收敛速度更快, 并能从相应的 SAR 图像中产生高质量的可见图像。的实验结果表明, 所提出的方法比最近的基于深度学习的方法更能产生可见光图像。

arxiv:https://arxiv.org/abs/1802.10036

[5]《Simultaneous Traffic Sign Detection and Boundary Estimation using Convolutional Neural Network》 IEEE Trans 2018

论文提出一种利用CNN同时估计交通标志位置和精确边界的新型交通标志检测系统。其将交通标志的边界估计作为2D姿态和形状类别预测问题来分析。

arxiv:https://arxiv.org/abs/1802.10019

[6]《Deep Learning Architectures for Face Recognition in Video Surveillance》

论文提出一种用于视频监控中人脸识别的深度学习框架。

arxiv:https://arxiv.org/abs/1802.09990

[7]《3D Object Super-Resolution》

论文介绍了在六正交深度投影超分辨率下, 在体素空间中快速上采样3D物体的新方法。

arxiv:https://arxiv.org/abs/1802.09987

[8]《Neural Stereoscopic Image Style Transfer》

论文提出一种基于双通道网络的立体图像的视觉一致风格迁移方法。

注:立体图像的风格迁移好像还可以注很多水。

arxiv:https://arxiv.org/abs/1802.09985

[9]《Mono-Camera 3D Multi-Object Tracking Using Deep Learning Detections and PMBM Filtering》

本文提出一种利用单目图像作为输入,在世界坐标系中生成检测对象轨迹的多目标跟踪算法,以填补从二维图像中无法直接估计到图像到检测目标距离的这一缺口。通过使用一个DNN来解决这个问题, 它通过训练来检测目标并从单个输入图像估计到到检测目标的距离。

注:很硬的一篇文章。

arxiv:https://arxiv.org/abs/1802.09975

[10]《Fusion of Multispectral Data Through Illumination-aware Deep Neural Networks for Pedestrian Detection》

论文提出一个强大的多光谱行人检测框架,其基于光照感知的行人检测和语义分割的多任务学习。

arxiv:https://arxiv.org/abs/1802.09972

[11]《Coarse to fine non-rigid registration: a chain of scale-specific neural networks for multimodal image alignment with application to remote sensing》

论文解决了在遥感和医学成像中的重要的多模态图像非刚性配准问题。论文设计了一种易于训练的全卷积神经网络,其能够学习特定于尺度的特性。

arxiv:https://arxiv.org/abs/1802.09816

[12]《Mixed Supervised Object Detection with Robust Objectness Transfer》

论文中考虑了利用现有的全标签类来改进新对象类别的弱监督检测 (WSD) , 我们称之为混合监督检测 (MSD)。

arxiv:https://arxiv.org/abs/1802.09778

[13]《Recurrent Residual Module for Fast Inference in Videos》

论文提出一个框架称为递归残差模块 (RRM),以加快CNN推理的视频识别任务。该框架采用两个连续帧的中间特征映射的相似性设计,大大减少了冗余计算。与以前的工作相比,论文所提出方法的特殊性质之一是精确计算每个帧的特征映射。

arxiv:https://arxiv.org/abs/1802.09723

[14]《Single-View Food Portion Estimation: Learning Image-to-Energy Mappings Using Generative Adversarial Networks》

论文提出一种利用生成对抗性网络(GAN)对食品图像中食物能量(卡路里)进行估计的食品部分估计方法。论文引入食物图像的"能量分配" 概念。为了训练 GAN,论文设计了一个基于ground truth的食物图像数据集食品标签和每一种食物图像的分割mask,以及食品图像的能量信息。论文的目标是学习从食物图像到食物能量的映射关系。

注:很有意思的GAN应用方向,哈哈,再也不用担心我长胖啦。

arxiv:https://arxiv.org/abs/1802.09670

[15]《Translating and Segmenting Multimodal Medical Volumes with Cycle- and Shape-Consistency Generative Adversarial Network》 CVPR 2018

论文提出一个通用的交叉模态合成方法与以下目标: 1) 合成逼真的3D图像,使用配对训练数据;2)确保一致的解剖结构,可以改变几何交叉模态合成中的畸变;3)通过使用有限的训练样本的模式合成数据,改进了体积分割。论文表明:这些目标使用用于图像合成和分割任务的端到端3D卷积神经网络(CNN)组成的生成器(generator)和分割器(segmentor)来实现。

arxiv:https://arxiv.org/abs/1802.09655

[16]《A Resilient Image Matching Method with an Affine Invariant Feature Detector and Descriptor》

论文提出一种新的图像特征匹配算法,并将仿射不变特征检测器 (AIFD)与提出的仿射不变特征描述符(AIFDd) 相结合。新算法的两个阶段可以提供足够的复原, 以查看点变化。

arxiv:https://arxiv.org/abs/1802.09623

[17]《A Robust Real-Time Automatic License Plate Recognition based on the YOLO Detector》

论文提出一种基于YOLO目标检测的鲁棒高效的ALPR系统。对每个ALPR阶段训练和finetune卷积神经网络 (CNNs) ,使它们在不同的条件下是健壮的(例如:相机,照明和背景的变化)。针对字符分割和识别的特点,设计了一种利用简单的数据增强技巧,如倒置车牌(LPs)和翻转字符的two-stage方法。实验结果表明:ALPR系统检测准确度高、速度快。

arxiv:https://arxiv.org/abs/1802.09567

[18]《A Mathematical Framework for Deep Learning in Elastic Source Imaging》

论文提出一种通用的数学框架,在传统的源重构算法中引入了低维流形正则化,从而提高了稀疏数据集的性能。

注:很硬的文章,很硬!也真的看不懂!

arxiv:https://arxiv.org/abs/1802.10055

[19]《VR-SGD: A Simple Stochastic Variance Reduction Method for Machine Learning》

论文提出SVRG的一个简单变体,称为方差减少随机梯度下降 (VR-SGD)。

注:很硬的文章,很硬!

arxiv:https://arxiv.org/abs/1802.09932

[20]《Query-Free Attacks on Industry-Grade Face Recognition Systems under Resource Constraints》

资源约束下工业级人脸识别系统的无查询攻击

arxiv:https://arxiv.org/abs/1802.09900

[21]《Graph-based Image Anomaly Detection》 IEEE Trans 2018

论文提出一种新的基于图的图像异常检测问题解决方案,其利用图傅里叶变换可以克服一些RX检测器的局限性,同时降低计算成本。

arxiv:https://arxiv.org/abs/1802.09843

[22]《Adversarial Active Learning for Deep Networks: a Margin Based Approach》

论文针对深度神经网络DNN,提出一种新的主动学习策略。目标是在训练过程中尽量减少从oracle查询数据批注的数量。

arxiv:https://arxiv.org/abs/1802.09841

[23]《Systematic Weight Pruning of DNNs using Alternating Direction Method of Multipliers》 ICLR 2018

论文利用乘法器(ADMM)的交替方向法,提出一种深度神经网络 (DNNs)的系统权重pruning框架。

arxiv:https://arxiv.org/abs/1802.05747

----------我是分割线----------

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-02-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏和蔼的张星的图像处理专栏

数字图像处理:

冈萨里斯数字图像处理的那本书的一小点点东西,数字图像处理其实是学过了的,这里我只是把这本书完整看一遍,也是略略的看,查漏补缺,前两张略过了,从第三章开始。

30740
来自专栏企鹅号快讯

吴恩达机器学习学习笔记05

建议阅读时间:5-8min 类型:机器学习基础教程 适应人群:大数据、人工智能 一、The problem of overfitting What is ove...

27060
来自专栏用户2442861的专栏

SIFT算法详解

如果你学习SIFI得目的是为了做检索,也许 OpenSSE 更适合你,欢迎使用。

71410
来自专栏人工智能头条

腾讯广点通:基于深度学习的图像语义分析及其应用

48660
来自专栏智能算法

基于SURF算法相似图像相对位置的寻找

例如以下两个相似证件的模板,若以其中一幅图像为模板,并给出相应的位置,可以给出其他相似图像进行定位相对应的位置,如下图所示,其中除了标题和样式一样,内容确是不同...

38970
来自专栏机器之心

学界 | 最小二乘GAN:比常规GAN更稳定,比WGAN收敛更迅速

选自Github 机器之心编译 参与:蒋思源 近来 GAN 证明是十分强大的。因为当真实数据的概率分布不可算时,传统生成模型无法直接应用,而 GAN 能以对抗...

43680
来自专栏机器之心

初学TensorFlow机器学习:如何实现线性回归?(附练习题)

选自Technica Curiosa 作者:Nishant Shukla 机器之心编译 参与:Jane W 本文的作者 Nishant Shukla 为加州大学...

33370
来自专栏智能算法

基础聚类算法:K-means算法

一、算法简介: 俗话说:“物以类聚,人以群分”,聚类算法不同于分类算法,对于一个 分类器 ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一...

71250
来自专栏大数据文摘

斯坦福深度学习课程第三弹:神经网络与反向传播

325140
来自专栏目标检测和深度学习

Google发布机器学习术语表 (包括简体中文)

Google 工程教育团队已经发布了多语种的 Google 机器学习术语表,该术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。语言版本...

29660

扫码关注云+社区

领取腾讯云代金券