人群密度估计--Fully Convolutional Crowd Counting On Highly Congested Scenes

Fully Convolutional Crowd Counting On Highly Congested Scenes The 12th International Conference on Computer Vision Theory and Applications (VISAPP) VISAPP 2017

本文使用 FCN 来做人群密度估计,主要参考 Single-image crowd counting via multi-column convolutional neural network, 主要改进的地方有以下三点:1)新的数据增强方法用于增加训练数据;2)提出一个更好的FCN网络;3)输入图像的多尺度用于解决 scale and perspective

FCN 用于人群计数主要的优点就是输入图像尺寸可以是任意的,输出的密度图根据输入尺寸自适应变化。目前已有的数据库主要的标记信息是人头位置标记。 这里主要是根据人头位置信息得到人群密度真值图。具体的生成过程主要是: N head annotations 根据人头位置生成 discrete density heatmap,对每个人头位置 加一个 unit impulse 到 discrete density heatmap 中去。

为了将离散密度能量图转为连续的函数,我们对每个人头位置使用一个adaptive Gaussian kernel 卷积 To convert this discrete density heatmap to a continuous function, convolution with an adaptive Gaussian kernel G σi is applied for each head annotation

2.1 Training Set Augmentation Scheme 由于大多数人群计数方面的数据库规模都比较小,所以数据增强计数就显得比较重要。

allow these crops to overlap for image recognition tasks, pixel-wise tasks can potentially overfit 从图像中裁出的图像块最好不要有重叠 所以我们采取了 four image quadrants as well as their horizontal flips are taken as training samples, ensuring no overlap

2.2 FCN Architecture

loss function

Shanghaitech Part B validation performance

2.3 Multi-Scale Averaging During Inference 我们对输入的测试图像使用多尺度输入,得到更好的密度估计,original size + 80% original size

UCF CC 50 dataset

Shanghaitech dataset

Cross dataset performance of our method

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏iOSDevLog

datacamp Cheat Sheet

1. Python For Data Science Cheat Sheet Importing Data.png

751
来自专栏AI科技大本营的专栏

教程 | 用AI生成猫的图片,撸猫人士必备

编译 | 小梁 【AI科技大本营导读】我们身边总是不乏各种各样的撸猫人士,面对朋友圈一波又一波晒猫的浪潮,作为学生狗和工作狗的我们只有羡慕的份,更流传有“吸猫...

3999
来自专栏深度学习那些事儿

利用pytorch实现神经网络风格迁移Neural Transfer

载入图像输入大小无要求,最终会被剪裁到相同大小,这是因为神经网络设计了一个特定的输入大小,因此内容图像和风格图像必须大小一致。

2017
来自专栏素质云笔记

SSD+caffe︱Single Shot MultiBox Detector 目标检测(一)

作者的思路就是Faster R-CNN+YOLO,利用YOLO的思路和Faster R-CNN的anchor box的思想。 . 0 导读 (本节来源于BO...

4806
来自专栏机器之心

深度 | 级联MobileNet-V2实现人脸关键点检测(附训练源码)

机器之心投稿 作者:余霆嵩 为了能在移动端进行实时的人脸关键点检测,本实验采用最新的轻量化模型——MobileNet-V2 作为基础模型,在 CelebA 数据...

4265
来自专栏人工智能

一步步教你理解LSTM

作者:王千发 编辑:田 旭 什么是LSTM 1 LSTM全名是Long Short-Term Memory,长短时记忆网络,可以用来处理时序数据,在自然语言处理...

2547
来自专栏CVer

风格迁移三部曲(二)之固定风格任意内容的快速风格迁移

上篇介绍了风格迁移三部曲(一)之普通风格迁移,本文将继续介绍第二种风格迁移方式:固定风格任意内容的快速风格迁移。

800
来自专栏小鹏的专栏

人脸检测——滑动窗口篇(训练和实现)

人脸检测:cascade cnn,mtcnn,都可以通过下面代码复现。但是下面的实现是比较low的,后面更新FCN的方法。 注意mtcnn的标签加了回归框,训练...

6278
来自专栏AI科技大本营的专栏

别磨叽,学完这篇你也是图像识别专家了

图像识别是当今深度学习的主流应用,而Keras是入门最容易、使用最便捷的深度学习框架,所以搞图像识别,你也得强调速度,不能磨叽。本文让你在最短时间内突破五个流行...

3747
来自专栏深度学习那些事儿

利用pytorch实现神经网络风格迁移Neural Transfer

载入图像输入大小无要求,最终会被剪裁到相同大小,这是因为神经网络设计了一个特定的输入大小,因此内容图像和风格图像必须大小一致。

1672

扫码关注云+社区