[计算机视觉论文速递] 2018-06-19 目标检测专场

导言

这篇文章有 4篇论文速递,都是目标检测方向,包括行人检测、车辆检测、指纹检测和目标跟踪等。

编辑: Amusi

校稿: Amusi

前戏

Amusi 将日常整理的论文都会同步发布到 daily-paper-computer-vision 上。名字有点露骨,还请见谅。喜欢的童鞋,欢迎star、fork和pull。

直接点击“阅读全文”即可访问daily-paper-computer-vision

link: https://github.com/amusi/daily-paper-computer-vision

目标检测(Object Detection)

《Remote Detection of Idling Cars Using Infrared Imaging and Deep Networks》

arXiv 2018

Proposed idling car detection framework

Abstract:怠速车辆(Idling vehicles)通过废气排放浪费能源并污染环境。在一些国家,禁止将车辆空转超过预定的时间,并且执法机构需要自动检测怠速车辆。我们提出第一个使用红外(IR)成像和深度网络来检测空转车的自动系统。

我们依靠怠速和停车时空热特征的差异,并使用长波红外摄像机监测车内温度。

我们将怠速车检测问题制定为IR图像序列中的时空事件检测,并采用深度网络进行时空建模。我们收集了第一个IR图像序列数据集,用于怠速汽车检测。首先,我们使用卷积神经网络在每个红外图像中检测汽车,该网络在规则的RGB图像上进行预先训练,并在IR图像上进行微调以获得更高的准确性。然后,我们跟踪检测到的汽车随着时间的推移,以识别停放的汽车。最后,我们使用每辆停放汽车的3D时空红外图像体积作为卷积和循环网络的输入,以将它们分类为空闲或不空闲。我们对各种卷积和循环体系结构的时间和时空建模方法进行了广泛的经验性评估。我们在我们的IR图像序列数据集上呈现出有前景的实验结果。

arXiv:https://arxiv.org/abs/1804.10805

注:怠速车辆(Idling vehicles)简单理解就是启动的车辆在原地不动的状态,感觉像是空转。

《MV-YOLO: Motion Vector-aided Tracking by Semantic Object Detection》

arXiv 2018

An overview of the proposed tracking method

Abstract:目标跟踪是许多可视化分析系统的基石。近年来,虽然在这方面取得了相当大的进展,但在实际视频中进行稳健,高效和准确的跟踪仍然是一项挑战。在本文中,我们提出了一种混合跟踪器,利用压缩视频流中的运动信息和作用于解码帧的通用语义对象检测器,构建适用于多种可视化分析应用的快速高效的跟踪引擎。所提出的方法与OTB跟踪数据集上的几个常见的跟踪器进行了比较。结果表明所提出的方法在速度和准确性方面的优点。所提出的方法相对于大多数现有跟踪器的另一个优点是其简单性和部署效率,这归因于其重用并重新利用系统中可能已存在的资源和信息,这是由于其他原因。

arXiv:https://arxiv.org/abs/1805.00107

《Altered Fingerprints: Detection and Localization》

arXiv 2018

An overview of the proposed approach for detection and localization of altered fingerprints

Abstract:Fingerprint alteration(也称为模糊呈现攻击)是有意篡改或破坏真实的 friction ridge patterns以避免AFIS识别。本文提出了一种检测和定位指纹变化的方法。我们的主要贡献是:(i)设计和训练指纹图像上的CNN模型和图像中以细节点为中心的局部斑块,以检测和定位指纹变化区域,以及(ii)训练生成对抗网络(GAN)合成变化的指纹其特征与真实改变的指纹相似。成功训练的GAN可以缓解研究中改变指纹图像的有限可用性。来自270个科目的4,815个改变指纹的数据库和相同数量的滚动指纹图像用于训练和测试我们的模型。所提出的方法在错误检测率(FDR)为2%时实现99.24%的真实检测率(TDR),优于公布的结果。改变后的指纹检测和定位模型和代码以及合成生成的改变后的指纹数据集将是开源的。

arXiv:https://arxiv.org/abs/1805.00911

《Real-Time Human Detection as an Edge Service Enabled by a Lightweight CNN》

IEEE EDGE 2018

L-CNN network layers specification

L-CNN: human object from variant angles and distances

Abstract:边缘计算(Edge computing)允许更多计算任务在网络边缘的分布式节点上发生。今天,许多对延迟敏感的任务关键型应用程序可以利用这些边缘设备来缩短时间延迟,甚至可以通过现场存在实现实时的在线决策。智能监控中的人体检测,行为识别和预测属于这一类别,在这种情况下,大量视频流数据的转换会花费宝贵的时间,并给通信网络带来沉重的压力。人们普遍认为,视频处理和目标检测是计算密集型且太昂贵而无法由资源有限的边缘设备来处理。受 depthwise separable 卷积和S ingle Shot Multi-Box Detector (SSD)的启发,本文介绍了一种轻量级卷积神经网络(LCNN)。通过缩小分类器的搜索空间以专注于监控视频帧中的人体对象,所提出的LCNN算法能够以对于边缘设备的负担得起的计算工作量来检测行人。原型已经在使用OpenCV库的边缘节点(Raspberry PI 3)上实现,使用真实世界的监控视频流可以获得令人满意的性能。实验研究验证了LCNN的设计,并表明它是在边缘计算密集型应用的有前景的方法。

arXiv:https://arxiv.org/abs/1805.00330

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

人工智能如何实现可靠的视觉追踪 |IJCAI2016论文详解

导读:2016国际人工智能联合会议(IJCAI2016)于7月9日至7月15日举行,今年会议聚焦于人类意识的人工智能,本文是IJCAI2016接收论文。除了论文...

3337
来自专栏小小挖掘机

IJOC“考虑聚合多样性的可扩展优化推荐系统”论文解析

本文是针对发表在《INFORMS Journal on Computing》上的一篇论文 “Incorporating Aggregate Diversity...

2643
来自专栏机器之心

业界 | 实时替换视频背景:谷歌展示全新移动端分割技术

选自Google Blog 作者: Valentin Bazarevsky、Andrei Tkachenka 机器之心编译 为视频中人物实时替换背景的技术能够催...

3689
来自专栏AI科技评论

纽约大学神经学教授Eero Simoncelli万字解析:机器生成的图像为何能骗过你的眼睛?

AI科技评论按:在刚刚闭幕的ICLR2017上,纽约大学神经学、数学、心理学教授Eero Simoncelli作为特邀嘉宾分享了他在机器表征、人类感知方面的研究...

4128
来自专栏小詹同学

人脸识别(一)——从零说起

这是关于人脸的第①篇原创!(源码在第三篇) 人脸识别的英文名称是 Face Recognition,前段时间查找资料学的时候发现,不少人将人脸识别和人脸检测(...

59410
来自专栏AI科技评论

学界 | DeepMind论文解读:通过删除神经元来了解深度学习

AI科技评论按:深度神经网络由许多单独的神经元组成,它们以复杂且违反人直觉的方式组合起来,以解决各种具有挑战性的任务。这种复杂性一方面赋予神经网络神秘力量,另一...

3415
来自专栏人工智能头条

AutoML 详解及其在推荐系统中的应用、优缺点

可能有人还记得一个非常古典的、关于推荐系统的例子:超市把尿布和啤酒摆一起,显著的增加了二者的销量。原因是很多买酒的父亲们看到旁边刚好有尿布,就回想起临行前,孩儿...

1621
来自专栏数据科学与人工智能

【应用】信用评分:第6部分 - 分割和拒绝推断

多少个评分卡? 标准是什么? 最佳做法是什么? - 是我们试图在评分卡开发早期回答的常见问题,从识别和证明评分卡数量的过程开始 - 称为分割。

3070
来自专栏企鹅号快讯

误区解读:ML和DL之间的区别和使用情况

【IT168 资讯】深度学习是机器学习的一个子集,都是人工智能的子集。机器学习与深度学习不完全属于一个拳击淘汰赛中,深度学习是机器学习的一个子集,而它们都是人工...

2398
来自专栏人工智能头条

深度学习 vs. 大数据:神经网络权值的版权属于谁?

1295

扫码关注云+社区

领取腾讯云代金券