[计算机视觉论文速递] 2018-05-08

通知:这篇文章有6篇论文速递信息,涉及CNN新网络、人脸检测、目标检测和超分辨率等方向(含2篇CVPR论文)

CNN

[1]《DCAN: Dual Channel-wise Alignment Networks for Unsupervised Scene Adaptation》

Abstract:收集(Harvesting)密集的像素级注释以训练深度神经网络进行语义分割代价非常大且难以处理的。尽管从容易获得标签的合成数据中学习听起来很有希望,但由于域差异(domain discrepancies)而对新颖的实际数据进行测试时性能明显下降。我们提出了双通道对准网络(Dual Channel-wise Alignment Networks,DCAN),这是一种简单而有效的方法,可减少像素级和特征级的域偏移。探索CNN特征map的每个通道的统计数据,我们的框架在图像生成器和分割网络中执行通道方式(channel-wise)的特征对齐,从而保留空间结构和语义信息。具体来说,给定来自源域的图像和来自目标域的未标记样本,生成器即时合成新图像以在外观上类似于来自目标域的样本,并且分割网络在预测语义之前进一步细化高级特征它们都利用来自目标域的采样图像的特征统计。与近期依靠对抗训练的工作不同,我们的框架非常轻巧,易于训练。将经过合成分割基准训练的模型与适合真实城市场景的大量实验证明了该框架的有效性。

arXiv:https://arxiv.org/abs/1804.05827


[2]《IGCV2: Interleaved Structured Sparse Convolutional Neural Networks》

CVPR 2018

Abstract:在本文中,我们研究了设计有效的卷积神经网络结构,这些结构的目的在于消除卷积核中的冗余。除了结构化稀疏内核,低阶(low-rank)内核和低阶内核的产品之外,结构化稀疏内核(structured sparse kernels)的产品是结构化的,它是解释最近开发的交错群卷积(interleaved group convolutions,IGC)及其变体(例如,Xception ),吸引了越来越多的关注。

受观察结果的启发,包含在IGC中的卷积中的卷积可以用相同的方式进一步分解,我们提出了一个模块化构建块{IGCV2:}交错结构化稀疏卷积。它将由两个结构化稀疏内核组成的交织群卷积推广到更多结构化稀疏内核的产品,进一步消除冗余。我们提出了互补条件和平衡条件来指导结构化稀疏核的设计,在模型大小,计算复杂度和分类精度三个方面取得平衡。实验结果证明了与交错群卷积和Xception相比,这三个方面的平衡优势,以及与其他最先进的架构设计方法相比的竞争性能。

arXiv:https://arxiv.org/abs/1804.06202

Face


[3]《Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks》

CVPR 2018

Abstract:旋转不变人脸检测,即检测具有任意旋转平面(RIP)角度的人脸,在不受约束的应用中广泛需要,但由于人脸外观的巨大变化仍然是一项具有挑战性的任务。大多数现有方法都以速度或准确度来处理大型RIP变体。为了更有效地解决这个问题,我们提出逐步校准网络(PCN)以粗到细的方式执行旋转不变的人脸检测。 PCN由三个阶段组成,每个阶段不仅可以区分人脸和非人脸,还可以逐个校准每个人脸候选人的RIP方向。通过将校准过程分为几个渐进步骤,并且只在早期阶段预测粗略方向,PCN可以实现精确和快速的校准。通过逐步减少RIP范围对面部和非面部进行二元分类,PCN可以以360°全角RIP角度精确检测面部。这种设计导致实时旋转不变的人脸检测器。在多向FDDB和包含广泛旋转面部的WIDER FACE的具有挑战性的子集上的实验表明,我们的PCN实现了相当高的性能。

arXiv:https://arxiv.org/abs/1804.06039

github:https://github.com/Jack-CV/PCN

Object Detection


[4]《Towards High Performance Video Object Detection for Mobiles》

Abstract:尽管最近在桌面GPU上成功实现了视频对象检测,但它的体系结构对手机来说仍然过于沉重。 稀疏特征传播和多帧特征聚合的关键原理是否适用于非常有限的计算资源也不清楚。 在本文中,我们提出了一个轻量级网络体系结构,用于在手机上进行视频对象检测。 轻量级图像对象检测器应用于稀疏关键帧。 一个非常小的网络Light Flow旨在跨帧建立对应关系。 流引导的GRU模块旨在有效地聚合关键帧上的特征。 对于非关键帧,执行稀疏特征传播。 整个网络可以进行端到端的培训。 所提出的系统在移动设备(例如,HuaWei Mate 8)上以25.6fps的速度获得60.2%的mAP分数。

arXiv:https://arxiv.org/abs/1804.05830

注:华为Mate8上跑,厉害了!


[5]《Robust Physical Adversarial Attack on Faster R-CNN Object Detector》

Abstract:鉴于直接操作数字输入空间中的图像像素的能力,敌手可能容易产生不可察觉的干扰以愚弄深度神经网络(DNN)图像分类器,如以前的工作中所证明的那样。在这项工作中,我们解决了制造物理对抗性扰动的更具挑战性的问题,以愚弄基于图像的物体探测器,如Faster R-CNN。攻击一个目标检测器比攻击一个图像分类器要困难得多,因为它需要误导不同尺度的多个边界框中的分类结果。将数字攻击扩展到物理世界增加了另一层困难,因为它要求扰动足够强大,以适应不同的观看距离和角度,照明条件和摄像机限制造成的真实世界的失真。我们表明,最初提出的用于增强图像分类中对抗性扰动鲁棒性的转换期望技术可成功适用于对象检测设置。我们的方法可能会产生对抗扰动的停车标志,这些标志一直被Faster R-CNN误检为其他物体,对自动驾驶车辆和其他安全关键型计算机视觉系统构成潜在威胁。

arXiv:https://arxiv.org/abs/1804.05810

Super Resolution


[6]《Densely Connected High Order Residual Network for Single Frame Image Super Resolution》

Abstract:深度卷积神经网络(DCNN)近来在超分辨率研究中被广泛采用,但以前的工作主要集中在模型中尽可能多的层次上,本文中我们提出了一种关于图像恢复问题的新观点,可以构造反映图像恢复过程的物理意义的神经网络模型,即将图像复原的先验知识直接嵌入到神经网络模型的结构中,我们采用对称非线性色空间(symmetric non-linear colorspace),S形(sigmoidal)传递, 为取代诸如sRGB,Rec.709等非对称非线性颜色空间的传统转换,我们还提出了一种“reuse plus patch”方法来处理不同缩放因子的超分辨率,我们提出的方法和模型表现出总体上优越的性能,even though our model was only roughly trained and could still be underfitting the training set.

arXiv:https://arxiv.org/abs/1804.05902

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-05-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【干货】深度学习中的数学理解— 教你深度学习背后的故事

【导读】如今,深度学习在各项任务中所向披靡,比如图像识别,语音处理和自然语言处理。但是,深度学习的理论探讨却比应用滞后好几个数量级,一方面是做应用马上能见效,然...

3087
来自专栏PPV课数据科学社区

小心训练模型,数据少也可以玩转深度学习

最近,Jeff Leek 在 Simply Stats 上发表了一篇题为「如果你的数据量不够大就不要使用深度学习」(Don’t use deep learnin...

3585
来自专栏大数据文摘

吴恩达机器学习中文版笔记:异常检测(Anomaly Detection)

3347
来自专栏机器学习算法工程师

如何训练深度神经网络?

译文:《How to train your Deep Neural Network》

1152
来自专栏数据派THU

10大深度学习架构:计算机视觉优秀从业者必备(附代码实现)

? 来源:机器之心 作者:FAIZAN SHAIKH 本文长度为3000字,建议阅读5分钟 本文包括深度学习领域的最新进展、keras 库中的代码实现以及论文...

3419
来自专栏目标检测和深度学习

94页论文综述卷积神经网络:从基础技术到研究前景

机器之心编译 参与:Panda 卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解。近日,约克大...

3867
来自专栏机器之心

就喜欢看综述论文:情感分析中的深度学习

6559
来自专栏CreateAMind

深度学习的动机与挑战之-流形学习

流形 (manifold) 指连接在一起的区域。数学上,它是指一组点,且每个点都有 其邻域。给定一个任意的点,其流形局部看起来像是欧几里得空间。日常生活中,我 ...

3160
来自专栏华章科技

计算机视觉这一年:这是最全的一份CV技术报告

The M Tank 编辑了一份报告《A Year in Computer Vision》,记录了 2016 至 2017 年计算机视觉领域的研究成果,对开发者...

761
来自专栏大数据挖掘DT机器学习

sklearn集成学习:如何调参?

---- Random Forest和Gradient Tree Boosting参数详解 2 如何调参?   2.1 调参的目标:偏差和方差的协调   2...

4867

扫码关注云+社区

领取腾讯云代金券