视频目标检测跟踪--Detect to Track and Track to Detect

Detect to Track and Track to Detect ICCV2017 https://github.com/feichtenhofer/detect-track ​​​​

本文针对视频目标检测问题提出一个统一的框架同时完成检测和跟踪 In this paper we propose a unified approach to tackle the problem of object detection in realistic video

ImageNet video object detection challenge (VID) 这个竞赛目前影响力是比较大

视频目标检测难度比较大,主要有以下几个原因: (i) size 视频的数据量比较大 VID has around 1.3M images, compared to around 400K in DET or 100K in COCO (ii)motion blur: 因为相机或物体运动导致的图像运动模糊 due to rapid camera or object motion (iii) quality 网络视频的质量是参差不齐的 (iv) partial occlusion 有时遮挡是比较严重的 (v) pose: unconventional object-to-camera poses are frequently seen in video 姿态的多样性

3 D&T Approach Detect and Track (D&T) 3.1. D&T overview We aim at jointly detecting and tracking (D&T) objects in video 我们是基于 R-FCN 检测框架,extend it for multi-frame detection and tracking

总体网络结构如下所示:

最大的亮点是 提出了 一个 RoI Tracking,这个模块将两帧直接的物体关联起来,完成物体跟踪 We compute correlation maps for all positions in a feature map and let RoI pooling operate on these feature maps for track regression

Performance comparison on the ImageNet VID validation set

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

仅用18天,英伟达新型GAN合成真假难辨高清明星脸

安妮 编译整理 量子位 出品 | 公众号 QbitAI 考眼力:你能分出下面哪张图是电脑合成的吗? 是这位神似年轻时莱昂纳多的神秘男子—— ? 还是这位卷发碧瞳...

2623
来自专栏数据科学与人工智能

计算机视觉界牛人牛事

作者:GarfieldEr007 原文地址:http://www.jianshu.com/p/b3bbeb7c67f5 CV人物1:Jianbo Shi史建波...

3415
来自专栏AI科技评论

干货 | 这里有一篇深度强化学习劝退文

AI 科技评论按:本文作者 Frankenstein,首发于作者的知乎主页,AI科技评论获取授权转载。 今天在学校又双叒叕提到了 Deep Reinforcem...

6026
来自专栏新智元

运用谷歌 BigQuery 与 TensorFlow 做公共大数据预测

【新智元导读】谷歌BigQuery的公共大数据集可提供训练数据和测试数据,TensorFlow开源软件库可提供机器学习模型。运用这两大谷歌开放资源,可以建立针对...

5456
来自专栏新智元

SIGGRAPH2018论文:深度强化学习教机器人自己穿衣服!(附视频)

随着AI技术进步的日新月异,现在的机器人越来越智能,但不管是机器人还是虚拟模型,基本都处于“赤身裸体”的状态,即便是穿了衣服,也是靠着外部的力量或帮助穿上的。

632
来自专栏新智元

5月机器学习TOP 10热文: Google Duplex,“换脸术”、网格单元(附文章地址)

1204
来自专栏大数据文摘

2017年你错过了哪些AI圈大事?最全盘点,值得收藏!

3027
来自专栏AI科技评论

干货分享 | 深度学习零基础进阶大法!

编者按:新手上路都会有一个疑问,如果自己没有相关基础,如何学习晦涩的专业知识?此前雷锋网编译了《从0到1:我是如何在一年内无师自通机器学习的?》,这篇文章讲述了...

3495
来自专栏CDA数据分析师

手把手教你通过游戏解决交通拥堵丨MIT深度学习公开课丨附课程PDF下载

作者 CDA 数据分析师 被堵在路上是件心累又烧钱的事儿,除了让人头疼还可能错过重要的约会。据统计,美国每年因交通堵塞的直接损失达到 780 亿美元。今年,M...

2545
来自专栏AI科技大本营的专栏

谷歌大脑深度学习从入门到精通视频课程[10.4]:自然语言处理——词向量

AI100 已经引入 Hugo Larochelle 教授的深度学习课程,会在公众号中推送,并且对视频中的 PPT 进行讲解。课后,我们会设计一系列的问题来巩...

2214

扫码关注云+社区