前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[计算机视觉论文速递] 2018-02-28

[计算机视觉论文速递] 2018-02-28

作者头像
Amusi
发布2018-04-12 09:35:54
9250
发布2018-04-12 09:35:54
举报
文章被收录于专栏:CVer

[1]《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》 CVPR 2018

论文提出一种CSRNet网络,用于理解高度拥挤的场景。

arxiv:https://arxiv.org/abs/1802.10062

[2]《Improving OCR Accuracy on Early Printed Books by combining Pretraining, Voting, and Active Learning》

论文整合预训练、投票和主动学习三种方法来提高早期印刷图书的OCR准确率。

arxiv:https://arxiv.org/abs/1802.10038

github:https://github.com/chreul/OCR_Testdata_EarlyPrintedBooks

[3]《Improving OCR Accuracy on Early Printed Books using Deep Convolutional Networks》

论文提出一种CNN和LSTM网络结合来提高OCR在早期印刷图书的准确率。

arxiv:https://arxiv.org/abs/1802.10033

[4]《Generating High Quality Visible Images from SAR Images Using CNNs》

论文提出了一种利用生成对抗性网络 (GAN) 生成合成孔径雷达 (SAR) 图像的高品质可见光图像的新方法。所提出的方法是基于CNNs的去斑和图像着色。级联结构在训练过程中的收敛速度更快, 并能从相应的 SAR 图像中产生高质量的可见图像。的实验结果表明, 所提出的方法比最近的基于深度学习的方法更能产生可见光图像。

arxiv:https://arxiv.org/abs/1802.10036

[5]《Simultaneous Traffic Sign Detection and Boundary Estimation using Convolutional Neural Network》 IEEE Trans 2018

论文提出一种利用CNN同时估计交通标志位置和精确边界的新型交通标志检测系统。其将交通标志的边界估计作为2D姿态和形状类别预测问题来分析。

arxiv:https://arxiv.org/abs/1802.10019

[6]《Deep Learning Architectures for Face Recognition in Video Surveillance》

论文提出一种用于视频监控中人脸识别的深度学习框架。

arxiv:https://arxiv.org/abs/1802.09990

[7]《3D Object Super-Resolution》

论文介绍了在六正交深度投影超分辨率下, 在体素空间中快速上采样3D物体的新方法。

arxiv:https://arxiv.org/abs/1802.09987

[8]《Neural Stereoscopic Image Style Transfer》

论文提出一种基于双通道网络的立体图像的视觉一致风格迁移方法。

注:立体图像的风格迁移好像还可以注很多水。

arxiv:https://arxiv.org/abs/1802.09985

[9]《Mono-Camera 3D Multi-Object Tracking Using Deep Learning Detections and PMBM Filtering》

本文提出一种利用单目图像作为输入,在世界坐标系中生成检测对象轨迹的多目标跟踪算法,以填补从二维图像中无法直接估计到图像到检测目标距离的这一缺口。通过使用一个DNN来解决这个问题, 它通过训练来检测目标并从单个输入图像估计到到检测目标的距离。

注:很硬的一篇文章。

arxiv:https://arxiv.org/abs/1802.09975

[10]《Fusion of Multispectral Data Through Illumination-aware Deep Neural Networks for Pedestrian Detection》

论文提出一个强大的多光谱行人检测框架,其基于光照感知的行人检测和语义分割的多任务学习。

arxiv:https://arxiv.org/abs/1802.09972

[11]《Coarse to fine non-rigid registration: a chain of scale-specific neural networks for multimodal image alignment with application to remote sensing》

论文解决了在遥感和医学成像中的重要的多模态图像非刚性配准问题。论文设计了一种易于训练的全卷积神经网络,其能够学习特定于尺度的特性。

arxiv:https://arxiv.org/abs/1802.09816

[12]《Mixed Supervised Object Detection with Robust Objectness Transfer》

论文中考虑了利用现有的全标签类来改进新对象类别的弱监督检测 (WSD) , 我们称之为混合监督检测 (MSD)。

arxiv:https://arxiv.org/abs/1802.09778

[13]《Recurrent Residual Module for Fast Inference in Videos》

论文提出一个框架称为递归残差模块 (RRM),以加快CNN推理的视频识别任务。该框架采用两个连续帧的中间特征映射的相似性设计,大大减少了冗余计算。与以前的工作相比,论文所提出方法的特殊性质之一是精确计算每个帧的特征映射。

arxiv:https://arxiv.org/abs/1802.09723

[14]《Single-View Food Portion Estimation: Learning Image-to-Energy Mappings Using Generative Adversarial Networks》

论文提出一种利用生成对抗性网络(GAN)对食品图像中食物能量(卡路里)进行估计的食品部分估计方法。论文引入食物图像的"能量分配" 概念。为了训练 GAN,论文设计了一个基于ground truth的食物图像数据集食品标签和每一种食物图像的分割mask,以及食品图像的能量信息。论文的目标是学习从食物图像到食物能量的映射关系。

注:很有意思的GAN应用方向,哈哈,再也不用担心我长胖啦。

arxiv:https://arxiv.org/abs/1802.09670

[15]《Translating and Segmenting Multimodal Medical Volumes with Cycle- and Shape-Consistency Generative Adversarial Network》 CVPR 2018

论文提出一个通用的交叉模态合成方法与以下目标: 1) 合成逼真的3D图像,使用配对训练数据;2)确保一致的解剖结构,可以改变几何交叉模态合成中的畸变;3)通过使用有限的训练样本的模式合成数据,改进了体积分割。论文表明:这些目标使用用于图像合成和分割任务的端到端3D卷积神经网络(CNN)组成的生成器(generator)和分割器(segmentor)来实现。

arxiv:https://arxiv.org/abs/1802.09655

[16]《A Resilient Image Matching Method with an Affine Invariant Feature Detector and Descriptor》

论文提出一种新的图像特征匹配算法,并将仿射不变特征检测器 (AIFD)与提出的仿射不变特征描述符(AIFDd) 相结合。新算法的两个阶段可以提供足够的复原, 以查看点变化。

arxiv:https://arxiv.org/abs/1802.09623

[17]《A Robust Real-Time Automatic License Plate Recognition based on the YOLO Detector》

论文提出一种基于YOLO目标检测的鲁棒高效的ALPR系统。对每个ALPR阶段训练和finetune卷积神经网络 (CNNs) ,使它们在不同的条件下是健壮的(例如:相机,照明和背景的变化)。针对字符分割和识别的特点,设计了一种利用简单的数据增强技巧,如倒置车牌(LPs)和翻转字符的two-stage方法。实验结果表明:ALPR系统检测准确度高、速度快。

arxiv:https://arxiv.org/abs/1802.09567

[18]《A Mathematical Framework for Deep Learning in Elastic Source Imaging》

论文提出一种通用的数学框架,在传统的源重构算法中引入了低维流形正则化,从而提高了稀疏数据集的性能。

注:很硬的文章,很硬!也真的看不懂!

arxiv:https://arxiv.org/abs/1802.10055

[19]《VR-SGD: A Simple Stochastic Variance Reduction Method for Machine Learning》

论文提出SVRG的一个简单变体,称为方差减少随机梯度下降 (VR-SGD)。

注:很硬的文章,很硬!

arxiv:https://arxiv.org/abs/1802.09932

[20]《Query-Free Attacks on Industry-Grade Face Recognition Systems under Resource Constraints》

资源约束下工业级人脸识别系统的无查询攻击

arxiv:https://arxiv.org/abs/1802.09900

[21]《Graph-based Image Anomaly Detection》 IEEE Trans 2018

论文提出一种新的基于图的图像异常检测问题解决方案,其利用图傅里叶变换可以克服一些RX检测器的局限性,同时降低计算成本。

arxiv:https://arxiv.org/abs/1802.09843

[22]《Adversarial Active Learning for Deep Networks: a Margin Based Approach》

论文针对深度神经网络DNN,提出一种新的主动学习策略。目标是在训练过程中尽量减少从oracle查询数据批注的数量。

arxiv:https://arxiv.org/abs/1802.09841

[23]《Systematic Weight Pruning of DNNs using Alternating Direction Method of Multipliers》 ICLR 2018

论文利用乘法器(ADMM)的交替方向法,提出一种深度神经网络 (DNNs)的系统权重pruning框架。

arxiv:https://arxiv.org/abs/1802.05747

----------我是分割线----------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-02-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CVer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档