专栏首页人工智能前沿讲习精选论文 | 视频目标跟踪专题【附打包下载】

精选论文 | 视频目标跟踪专题【附打包下载】

关注文章公众号 回复"SFFAI30论文"获取本主题精选论文

论文推荐

随着近年来智能城市监控的发展和自动驾驶的兴起,视频目标跟踪得到了更多的研究者的关注,其中包括单目标跟踪、多目标跟踪、跨摄像头多目标跟踪等等。目标跟踪也涉及很多相关领域,例如视频分割、轨迹预测、行人重识别等等。5月30日(周四),两位主讲嘉宾(高旭,王强)为大家精选了视频目标跟踪及相关领域中的几篇代表性工作,和大家一起学习、分享最新的研究进展。

你可以认真阅读,来现场和讲者面对面交流哦。

1

推荐理由:本文来自于ICCV 2017,首次较为系统的用深度学习框架分别将跟踪中的外观模型、运动模型、交互模型用到了多目标跟踪框架中,实验结果提升明显。

推荐理由来自:高旭

2

推荐理由:本文来自于ECCV 2018。这篇文章很好的将空间注意力模型与实践注意力模型用到了多目标跟踪框架中,也就是既考虑到了检测框中真正包含目标的区域,又考虑到了已跟踪序列在不同时刻的置信度,实验结果提升明显。

推荐理由来自:高旭

3

推荐理由:本文来源于CVPR 2018。这篇文章主要解决的是轨迹预测问题,即已知当前帧某一目标之前的轨迹,预测该目标之后的轨迹。该方法提出用生成对抗的思路来生成多条可能存在的未来轨迹,思路比较新颖。

推荐理由来自:高旭

4

推荐理由:2016年牛津大学的Luca Bertinetto博士提出的全卷积孪生网络架构作为近期深度学习应用在目标跟踪领域的代表作。该方法利用数据驱动的方式进行离线训练,通过比较样本间的相似度学习,可有效区分目标与背景。在线过程中,其全卷积的架构可以快速在线运行,算法速度达到86fps,是首个可以实时运行的深度学习目标跟踪算法。该方法因其简洁有效的设计称为目前视觉跟踪中最有前景的方向之一。

推荐理由来自:王强

5

推荐理由:商汤科技在CVPR2018提出将目标检测中的RPN (Region Proposal Network)模块引入到目标跟踪领域,该论文得到了目标跟踪领域研究者的广泛关注。该方法将目标跟踪的目标函数进行有效扩展,利用神经网络进行目标框的回归学习。大幅度提升了目标跟踪的精度性能,在目标跟踪领域的多个数据集中取得当前最好的结果(state-of-the-art);同时该方法摆脱了多尺度测试的束缚,大幅度提升了算法的跟踪速度达到160fps,具有较强的实际使用价值。

推荐理由来自:王强

6

推荐理由:Martin Danelljan博士发表在CVPR2019上的最新论文(Oral)。该方法并没有继承近期非常热门的孪生网络架构,而是提出将目标跟踪分为目标分类和目标评价两个网络部分,前者分类用于粗定位,后者用于精细定位,即多阶段跟踪。目标估计网络使用了ECCV18的IoUNet结构,离线过程进行大规模训练学习,最大化预测框与真实框的IoU;目标分类网络使用了深度回归网络结构,由2层卷积层构成,在线训练,根据输出的map选择候选框交给目标估计网络,并且提出了新的快速在线训练方法。性能在多个数据集中取得最好结果,GPU下达到30fps。

推荐理由来自:王强

7

推荐理由:中科院自动化所和牛津大学联合发表在CVPR2019年的最新论文,该论文提出一个统一的目标跟踪和视频目标分割的统一框架。利用孪生网络同时预测目标的分割结果以及矩形框,通过离线过程中的多任务学习有效提升网络的判别能力。该方法进一步扩展目标跟踪的目标表述,通过目标的分割预测,可以得到最精确的目标估计。同时,对于视频目标分割,该方法极大简化了初始化输入(由mask的初始化简化为矩形框的初始化),在GPU达到超实时的运算速度。将多个领域进行整合处理的思路也值得一读!

推荐理由来自:王强

本文分享自微信公众号 - 人工智能前沿讲习(AIFrontier),作者:must

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 视频中的多目标跟踪【附PPT与视频资料】

    目前视频多目标跟踪在智能安防、自动驾驶、医疗等领域都有非常多的应用前景,但同时也是计算机视觉中比较困难的一个问题。这主要是由于待跟踪的目标被遮挡造成的。本文主要...

    马上科普尚尚
  • SFFAI分享 | 张志鹏:SiamDW Real-Time Visual Tracking【附PPT与视频资料】

    目标跟踪是计算机视觉的基本任务之一,近年来随着大量跟踪数据库如OTB,VOT,LASOT,GOT10K的提出,以及VOT比赛的推广,单目标跟踪领域迅速发展。而这...

    马上科普尚尚
  • CVPR2020论文解读 | VIBE:Video Inference for Human Shape

    3D人体姿态与形态估计CVPR 2020的一篇论文笔记,VIBE: Video Inference for Human Body Pose and Shape ...

    马上科普尚尚
  • Kaggle放大招:简单几步实现海量数据分析及可视化

    【新智元导读】近期,Kaggle发布了新的数据分析及可视化工具——Kaggle Kerneler bot,用户只需上传数据集,便可用Python为用户自动获取相...

    新智元
  • Kaggle放大招:简单几步实现海量数据分析及可视化

    Kaggle Kerneler bot是一个自动生成的kernel,其中包含了演示如何读取数据以及分析工作的starter代码。用户可以进入任意一个已经发布的项...

    朱晓霞
  • Android设计模式应用-组合模式

    文件目录就采用了组合模式,很典型的一个例子,一个文件夹下面有文件和子文件夹,子文件夹下面又含有文件和子文件夹,

    wust小吴
  • 一个小时学会Maven

    在开发中经常需要依赖第三方的包,包与包之间存在依赖关系,版本间还有兼容性问题,有时还里要将旧的包升级或降级,当项目复杂到一定程度时包管理变得非常重要。

    张果
  • 解决 Idea 卡在 Resolving Maven dependencies ...

    Idea卡在Resolving Maven dependencies的解决方案 在Reimpot All Maven Porjects时, 如果项目过大, m...

    微风-- 轻许--
  • YOLACT++:目前最热门的实时实例分割开源库

    YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法,近期该文...

    CV君
  • 浅谈Ajax的优缺点

    AJAX (Asynchronous JavaScript and XML) 是一种交互式动态web应用开发技术,该技术能提供富用户体验。完全的 AJAX应用给...

    wangxl

扫码关注云+社区

领取腾讯云代金券