视频目标检测跟踪--Detect to Track and Track to Detect

Detect to Track and Track to Detect ICCV2017 https://github.com/feichtenhofer/detect-track ​​​​

本文针对视频目标检测问题提出一个统一的框架同时完成检测和跟踪 In this paper we propose a unified approach to tackle the problem of object detection in realistic video

ImageNet video object detection challenge (VID) 这个竞赛目前影响力是比较大

视频目标检测难度比较大,主要有以下几个原因: (i) size 视频的数据量比较大 VID has around 1.3M images, compared to around 400K in DET or 100K in COCO (ii)motion blur: 因为相机或物体运动导致的图像运动模糊 due to rapid camera or object motion (iii) quality 网络视频的质量是参差不齐的 (iv) partial occlusion 有时遮挡是比较严重的 (v) pose: unconventional object-to-camera poses are frequently seen in video 姿态的多样性

3 D&T Approach Detect and Track (D&T) 3.1. D&T overview We aim at jointly detecting and tracking (D&T) objects in video 我们是基于 R-FCN 检测框架,extend it for multi-frame detection and tracking

总体网络结构如下所示:

最大的亮点是 提出了 一个 RoI Tracking,这个模块将两帧直接的物体关联起来,完成物体跟踪 We compute correlation maps for all positions in a feature map and let RoI pooling operate on these feature maps for track regression

Performance comparison on the ImageNet VID validation set

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SnailTyan

Single Shot MultiBox Detector论文翻译——中文版

SSD: Single Shot MultiBox Detector 摘要 我们提出了一种使用单个深度神经网络来检测图像中的目标的方法。我们的方法命名为SSD,...

2330
来自专栏人工智能LeadAI

边缘检测论文笔记

摘要:这篇论文提出了一种基于FCNN和深度监督网络的新的边缘检测算法HED,它解决了两个重要的问题,1)整体图片的训练和预测,2)多尺度多层级的特征学习。HED...

952
来自专栏SnailTyan

Single Shot MultiBox Detector论文翻译——中英文对照

SSD: Single Shot MultiBox Detector Abstract We present a method for detecting ob...

1890
来自专栏数据科学与人工智能

代价函数

代价函数,度量【假设集】的准确性。 机器学习中常用的代价函数,总结如下: 1 误差平方和函数 ? 说明:yi 是模型预测值,oi是样本实际值 2 交叉熵函数...

3306
来自专栏人工智能的秘密

4种普遍的机器学习分类算法

本文主要介绍了 4 种应用比较普遍的的机器学习算法,但是机器学习算法还有其他很多不同的算法,大家感兴趣的可以自己去了解。

2000
来自专栏Deep learning进阶路

深度学习论文随记(二)---VGGNet模型解读-2014年(Very Deep Convolutional Networks for Large-Scale Image Recognition)

深度学习论文随记(二)---VGGNet模型解读 Very Deep Convolutional Networks forLarge-Scale Image ...

2520
来自专栏MelonTeam专栏

机器学习入门系列02,Regression 回归:案例研究

引用课程:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html 先看这里,可能由于你正在查看这个平...

1787
来自专栏新智元

谷歌官方:反向传播算法图解

【新智元导读】反向传播算法(BP算法)是目前用来训练人工神经网络的最常用且最有效的算法。作为谷歌机器学习速成课程的配套材料,谷歌推出一个演示网站,直观地介绍了反...

820
来自专栏机器学习算法全栈工程师

你知道如何计算CNN感受野吗?这里有一份详细指南

本文翻译自A guide to receptive field arithmetic for Convolutional Neural Networks,原作者...

1136
来自专栏红色石头的机器学习之路

Coursera吴恩达《构建机器学习项目》课程笔记(2)-- 机器学习策略(下)

这是Andrew Ng深度学习专项课程第三门课《构建机器学习项目》的第二节笔记,第一节笔记入口:Coursera吴恩达《构建机器学习项目》课程笔记(1)– 机器...

2100

扫码关注云+社区