[计算机视觉论文速递] 2018-05-19

导言

这篇文章有4篇论文速递信息,涉及人脸识别(综述)、人脸检测、3D 目标检测和姿态估计和目标检测等方向(含2篇CVPR 2018)。

编辑: Amusi

校稿: Amusi

前戏

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

直接点击“阅读全文”即可访问daily-paper-computer-vision

link: https://github.com/amusi/daily-paper-computer-vision

Face

《Deep Face Recognition: A Survey》

2018 arXiv

Abstract:在图形处理单元(GPU)、大量待标注数据和更高级算法的驱动下,深度学习使得计算机视觉领域受到了极大的冲击,并且使包括人脸识别(FR)在内的实际应用受益匪浅。Deep FR 方法利用深层网络学习更多的不同(discriminative)表征,显著地改善现有技术并超越人类表现(97.53%)。在本文中,我们提供深度FR方法的全面调查,包括数据,算法和场景。首先,我们总结了常用的训练和测试数据集。然后,数据预处理方法分为两类:“一对多增强”和“多对一标准化”。其次,对于算法,我们总结了现有技术方法中使用的不同网络架构和损失函数。第三,我们回顾了深度FR中的几个场景,比如视频FR,3D FR和不同年龄段(Cross-Age) FR。最后,强调了当前方法的一些潜在缺陷和几个未来方向。

arXiv:https://arxiv.org/abs/1804.06655

注:综述性文章,实属好评!

《SFace: An Efficient Network for Face Detection in Large Scale Variations》

2018 arXiv

Abstract:人脸检测是许多应用程序(如人脸识别)的基础研究主题。特别是最近卷积神经网络的发展取得了令人印象深刻的进展。然而,广泛存在于高分辨率图像/视频中的大范围变化的问题在文献中尚未得到很好的解决。在本文中,我们提出了一种名为SFace的新算法,它有效地集成了基于 Anchor 的方法和无 Anchor 方法来解决尺度(scale)问题。还引入了称为4K-Face的新数据集来评估具有极大尺度变化的人脸检测的性能。SFace架构在新的4K-Face基准测试中显示出可喜的成果。 此外,我们的方法可以以每秒50帧(fps)的速度运行,标准WIDER FACE数据集的准确率为80%AP,其速度比现有算法高出近一个数量级,同时达到了比较性能。

arXiv:https://arxiv.org/abs/1804.06559

3D Object Detection and Pose Estimation

《Falling Things: A Synthetic Dataset for 3D Object Detection and Pose Estimation》

CVPR 2018 Workshop on Real World Challenges and New Benchmarks for Deep Learning in Robotic Vision

Abstarct:本文提出了一个名为Falling Things(FAT)的新数据集,用于推进机器人技术环境下的物体检测(Object Detectiion)和3D姿态估计的最新技术。通过对复杂构图和高图形质量的对象模型和背景进行综合组合,我们能够为所有图像中的所有对象生成具有精确三维姿态标注的照片真实感图像。我们的数据集包含来自YCB数据集的21个家庭对象的60k注释照片。对于每个图像,我们为所有对象提供3D姿势,每像素类分割以及2D / 3D边界框坐标。为了便于测试不同的输入模式,我们提供单目和立体双目 RGB图像以及配准(registered)的密集深度图像。 我们详细描述了数据的生成过程和统计分析。

arXiv:https://arxiv.org/abs/1804.06534

datasets:http://research.nvidia.com/publication/2018-06_Falling-Things

Object Detection

《Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization》

CVPR 2018 Workshop on Autonomous Driving

Abstract:我们提出了一种用于训练用于使用合成图像进行物体检测的深度神经网络的系统。为了解决真实世界数据的变化问题,系统依赖于域随机化技术(domain randomization),其中模拟器(simulator)的参数(例如照明,姿态,物体纹理等)以非现实的方式随机化,迫使神经网络学习感兴趣对象的基本特征。我们探索这些参数的重要性,表明可以仅使用非艺术性生成的合成数据生成具有引人注目的性能的网络。通过对实际数据进行额外的微调,网络比单独使用真实数据的性能更好。这个结果为使用低成本的合成数据训练神经网络提供了可能性,同时避免了收集大量手工标注的真实世界数据或生成高保真度合成世界(high-fidelity synthetic worlds)的需求 - 这两者都是许多应用的瓶颈。该方法在KITTI数据集上对汽车的边界框检测进行评估。

arXiv:https://arxiv.org/abs/1804.06516

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-05-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏媒矿工厂

HDR关键技术:质量评价技术(续)

在上一篇HDR质量评价帖中,我们列举了业内常见的HDR质量评估算法,然而不同算法有不同的应用领域。本文将结合重要的HDR技术,进一步描述HDR质量评价技术。本文...

73030
来自专栏SIGAI学习与实践平台

深度强化学习综述(上)

人工智能中的很多应用问题需要算法在每个时刻做出决策并执行动作。对于围棋,每一步需要决定在棋盘的哪个位置放置棋子,以最大可能的战胜对手;对于自动驾驶算法,需要根据...

19130
来自专栏PPV课数据科学社区

每个数据科学家都应该知道的六个概率分布

介绍 假设你是一所大学的老师。在对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据录入人员,并告诉他创建一个包含所有学生成...

49260
来自专栏玉树芝兰

如何用机器学习处理二元分类任务?

图像是猫还是狗?情感是正还是负?贷还是不贷?这些问题,该如何使用合适的机器学习模型来解决呢?

11420
来自专栏AI科技评论

CNCC 2016 | 山世光:深度化的人脸检测与识别技术—进展与展望

编者注:本文根据山世光在 CNCC 2016 可视媒体计算论坛上所做的报告《深度化的人脸检测与识别技术:进展与问题》编辑整理而来,在未改变原意的基础上略有删减。...

37440
来自专栏天天P图攻城狮

终端图像处理实践-实时唇彩效果优化

45130
来自专栏专知

如何用机器学习处理二元分类任务?

图像是猫还是狗?情感是正还是负?贷还是不贷?这些问题,该如何使用合适的机器学习模型来解决呢?

19930
来自专栏IT技术精选文摘

逻辑回归如何用于新用户识别与触达

目前,某产品营收运营正处在从过去依赖产品经理的经验到通过数据来驱动增长(Growth Hacking)的过渡期。在这里梳理一下通过数据模型帮助该产品营收的一些经...

12130
来自专栏智能算法

数据+进化算法=数据驱动的进化优化?进化算法PK数学优化

数据驱动的进化优化是什么,仅仅就是数据+优化算法吗?数据驱动的进化优化适用于哪些应用场景?传统的数学优化方法是否迎来了新一轮的挑战。本文将为您深入浅出的解答以上...

21030
来自专栏计算机视觉战队

基于区域的目标检测——细粒度

今天是二月的第一天,是一个月的新的开始,估计现在有很多学生都已经进入了漫长的寒假,希望你们在寒假空闲之余可以慢慢来阅读我们的精彩推送。今天我们将的就是目标检测,...

370100

扫码关注云+社区

领取腾讯云代金券