人群密度估计--Fully Convolutional Crowd Counting On Highly Congested Scenes

Fully Convolutional Crowd Counting On Highly Congested Scenes The 12th International Conference on Computer Vision Theory and Applications (VISAPP) VISAPP 2017

本文使用 FCN 来做人群密度估计,主要参考 Single-image crowd counting via multi-column convolutional neural network, 主要改进的地方有以下三点:1)新的数据增强方法用于增加训练数据;2)提出一个更好的FCN网络;3)输入图像的多尺度用于解决 scale and perspective

FCN 用于人群计数主要的优点就是输入图像尺寸可以是任意的,输出的密度图根据输入尺寸自适应变化。目前已有的数据库主要的标记信息是人头位置标记。 这里主要是根据人头位置信息得到人群密度真值图。具体的生成过程主要是: N head annotations 根据人头位置生成 discrete density heatmap,对每个人头位置 加一个 unit impulse 到 discrete density heatmap 中去。

为了将离散密度能量图转为连续的函数,我们对每个人头位置使用一个adaptive Gaussian kernel 卷积 To convert this discrete density heatmap to a continuous function, convolution with an adaptive Gaussian kernel G σi is applied for each head annotation

2.1 Training Set Augmentation Scheme 由于大多数人群计数方面的数据库规模都比较小,所以数据增强计数就显得比较重要。

allow these crops to overlap for image recognition tasks, pixel-wise tasks can potentially overfit 从图像中裁出的图像块最好不要有重叠 所以我们采取了 four image quadrants as well as their horizontal flips are taken as training samples, ensuring no overlap

2.2 FCN Architecture

loss function

Shanghaitech Part B validation performance

2.3 Multi-Scale Averaging During Inference 我们对输入的测试图像使用多尺度输入,得到更好的密度估计,original size + 80% original size

UCF CC 50 dataset

Shanghaitech dataset

Cross dataset performance of our method

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在Python中规范化和标准化时间序列数据

如果您的时间序列数据具有连续的尺度或分布,则在某些机器学习算法将获得更好的性能。

3119
来自专栏进击的程序猿

线性回归背后的数学

本文是YouTube上视频How to Do Linear Regression the Right Way笔记

882
来自专栏书山有路勤为径

卷积滤波器与边缘检测

高低频率 高频图像是强度变化很大的图像。并且亮度级别从一个像素到下一个像素快速变化。低频图像可以是亮度相对均匀或变化非常慢的图像。这是一个例子中最容易看到的。

1002
来自专栏机器之心

资源 | 从ReLU到Sinc,26种神经网络激活函数可视化

2849
来自专栏量化投资与机器学习

【Python机器学习】信息熵和在决策树中的运用(附源码)

之前在【Python机器学习】系列五决策树非线性回归与分类(深度详细附源码)一期中, 我们提到了用熵来度量信息的不确定性和信息增益。今天我们来详细解读一下什么是...

2097
来自专栏杨熹的专栏

支持向量机

Udacity Machine Learning Support Vector Machine ---- 在做分类问题时,想要找到最好的那条线: ? 会选择...

3285
来自专栏图形学与OpenGL

机械版CG 实验6 简单光照明模型实现

Phong光照明模型是由物体表面上一点P反射到视点的光强I为环境光的反射光强Ie、理想漫反射光强Id、和镜面反射光Is的总和,即

801
来自专栏机器学习与自然语言处理

Stanford机器学习笔记-10. 降维(Dimensionality Reduction)

10. Dimensionality Reduction Content  10. Dimensionality Reduction   10.1 Mot...

3768
来自专栏Petrichor的专栏

opencv: Canny边缘检测(图示+源码)

minVal = 0, maxVal = 50 (../pic/concatenate/canny_edge[000,050].jpg):

982
来自专栏PPV课数据科学社区

连载 | 概率论与数理统计(3) – 一维离散型随机变量及其Python实现

上一小节对随机变量做了一个概述,这一节主要记录一维离散型随机变量以及关于它们的一些性质。对于概率论与数理统计方面的计算及可视化,主要的Python包有scipy...

842

扫码关注云+社区