车辆计数--FCN-rLSTM: Deep Spatio-Temporal Neural Networks for Vehicle Counting in City Cameras

FCN-rLSTM: Deep Spatio-Temporal Neural Networks for Vehicle Counting in City Cameras ICCV2017 https://arxiv.org/abs/1707.09476

利用监控相机来完成车辆计数,FCN+LSTM,使用 residual learning 将两者联系起来。FCN for pixel-level prediction and the strengths of LSTM for learning complex temporal dynamics

监控相机得到的视频具有以下几个特点: 1) Low frame rate 低帧率 1 fps to 0.3 fps 2)低分辨率 352 × 240, 320 × 240 or 704 × 480 3)高遮挡 特别是交通拥堵时 4)Large perspective 导致车辆尺度范围大 以上四个特点导致用这些视频来进行车辆计数难度较大。

3 FCN-rLSTM for vehicle counting 这里我们采用 FCN 将 dense (pixel-level) feature 映射为 车辆密度,避免了单个车辆的检测或跟踪。基于 FCN的密度估计 可以让我们输入任意分辨率的图像,输出车辆密度图和输入图像尺寸一样大小。当前基于密度的计数方法直接对密度图求和得到总数。这么做误差比较大,因为 large perspective and oversized vehicles (big bus or big truck),所以我们提出了 FCN-rLSTM network 来提高计数精度

3.1. FCN-rLSTM Model & Network Architecture

To accelerate training, FCN and LSTM are connected in a residual learning fashion as illustrated in Figure 4

3.2. Spatio-Temporal Multi-Task Learning 这里首先介绍了怎么生成训练样本的真值密度图,和人群计数的方法是一样的。 2D Gaussian kernels 接着定义了损失函数,包括两个部分

4 Experiments Different configurations of FCN-rLSTM

Results comparison on WebCamT

Results comparison on TRANCOS dataset

Estimated density map for multiple cameras

Results comparison on UCSD dataset

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

可能提高GAN性能的方法介绍

生成器试图找到最好的图像来欺骗鉴别器。当两个网络互相对抗时,“最佳”图像不断变化。但是,优化可能会变得过于贪心,使其陷入永无止境的猫捉老鼠游戏中。这是模型不收敛...

1974
来自专栏CVer

[计算机视觉论文速递] 2018-04-23

Abstract:我们介绍和解决了Zero-Shot 目标检测(ZSD)的问题,它旨在检测训练期间未观察到的物体类别。我们与一组具有挑战性的对象类一起工作,而不...

902
来自专栏IT派

推荐!PlayGround:可视化神经网络

PlayGround是一个在线演示、实验的神经网络平台,是一个入门神经网络非常直观的网站。这个图形化平台非常强大,将神经网络的训练过程直接可视化。同时也能让我们...

1352
来自专栏数据派THU

独家 | 初学者的问题:在神经网络中应使用多少隐藏层/神经元?(附实例)

本文将通过两个简单的例子,讲解确定所需隐藏层和神经元数量的方法,帮助初学者构建神经网络。

1560
来自专栏机器学习算法工程师

全面解读Group Normbalization-(吴育昕-何凯明 重磅之作)

一句话概括,GroupNormbalization(GN)是一种新的深度学习归一化方式,可以替代BN。

1524
来自专栏机器之心

深度 | 向手机端神经网络进发:MobileNet压缩指南

4067
来自专栏AI科技大本营的专栏

如何让渣画质图片达到逼真效果,试试GAN吧

翻译 | 梁红丽 编辑 | Just 【AI科技大本营导读】在最终视觉呈现效果上,现有的用于极限学习图片压缩的算法似乎都不尽人意,本文作者则使用了 GAN,允许...

3579
来自专栏机器之心

CVPR 2018 | Spotlight论文:解耦神经网络DCNet,性能优于标准CNN

1844
来自专栏专知

【深度】Deep Visualization:可视化并理解CNN

【导读】本文利用非参数化方法来可视化CNN模型,希望帮助理解CNN。 专知公众号转载已获知乎作者余俊授权。 原文地址: https://zhuanlan.zhi...

6624
来自专栏CDA数据分析师

随机之美——机器学习中的随机森林模型

摘要:随机森林和决策树相比,能更好的防止过拟合。虽然每个基分类器很弱,但最后组合的结果通常很强,这也类似于:“三个臭皮匠顶个诸葛亮”的思想。对比发现Random...

2179

扫码关注云+社区