人群密度估计--CrowdNet: A Deep Convolutional Network for Dense Crowd Counting

CrowdNet: A Deep Convolutional Network for Dense Crowd Counting published in the proceedings of ACM Conference on Multimedia (ACMMM) - 2016 http://val.serc.iisc.ernet.in/CrowdNet/ Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet

针对人群密度估计问题,本文使用 deep and shallow, fully convolutional networks 两个网络相结合实现 large scale variations, high-level semantic information (face/body detectors) and the low-level features (blob detectors)

我们的网络结构如下所示:

Deep Network 主要用捕获 high-level semantics 信息,这里我们采用一个类似 VGG网络的结构,我们去掉了全连接层,网络变成了全卷积层。同时原来的 VGG网络使用了5个 max-pool layers each with a stride of 2,最终的特征图大小只有输入图像尺寸的1/32。我们这里需要输出像素级别的人群密度估计图,所以我们 set the stride of the fourth max-pool layer to 1 and remove the fifth pooling layer,这样最终的特征图大小只有输入图像尺寸的 1/8.

the receptive-field mismatch caused by the removal of stride in the fourth max-pool layer 将第四最大池化层的步长设置为1会导致 the receptive-field mismatch, 这里我们使用了文献【4】中的 膨胀卷积。其结果就相当第四最大池化层的步长设置为2

Shallow Network 这里我们使用一个 shallow convolutional network 主要用于检测远离相机的人头, used for the detection of small head-blobs

Combination of Deep and Shallow Networks 这里 concatenate Deep and Shallow Networks 的输出,输入图像尺寸的 1/8, 使用一个 1x1 convolution layer, 再 upsampled to the size of the input image using bilinear interpolation to obtain the final crowd density prediction

3.2 Ground Truth generate our ground truth by simply blurring each head annotation using a Gaussian kernel normalized to sum to one

3.3 Data Augmentation 这里主要使用两类数据增强 primarily perform two types of augmentation 1)对 scale variations 我们多尺度采样

2)对容易错误的样本我们多训练几次 sampling high density patches more often

4 EXPERIMENTS

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据处理

矩阵奇异分解(SVD)应用

893
来自专栏社区的朋友们

[ I am Jarvis ] :聊聊 FaceID 背后的深度学习视觉算法

在苹果用 FaceID 取代 TouchID 的背后,是强大的视觉算法支持,让 iPhoneX 有能力识别各种欺骗和伪装,从而敢于将 FaceID 作为最重要的...

9972
来自专栏新智元

吴恩达斯坦福CS230第一名:图像超级补全,效果惊艳(附代码)

【新智元导读】图像修复(Image inpainting)是一个已经被广泛研究的计算机视觉问题,即恢复图像中缺失的部分。斯坦福大学CS230课程的Mark Sa...

1153
来自专栏AI研习社

语义分割和转置卷积

分割对图像分析是必不可少的。语义分割描述了每个像素与类别标记的关联过程,(例如:花朵、人物、道路、天空、海洋、或者汽车)。

1242
来自专栏AI科技评论

大会 | DiracNets:无需跳层连接的ResNet

AI 科技评论按:本文作者 David 9,首发于作者的个人博客,AI 科技评论获其授权转载。 虚拟化技术牺牲硬件开销和性能,换来软件功能的灵活性;深度模型也类...

3516
来自专栏PaddlePaddle

转载|使用PaddleFluid和TensorFlow实现图像分类网络SE_ResNeXt

视觉(vision)、自然语言处理(Nature Language Processing, NLP)、语音(Speech)是深度学习研究的三大方向。三大领域各自...

1413
来自专栏大数据挖掘DT机器学习

TensorFlow和深度学习入门教程

前言 上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络,并把其PPT的参考学习资料给了我们, 这是codelabs上的教程:《Tensor...

3416
来自专栏机器之心

资源 | MIT提出Matlab插件mNeuron:实现深度模型神经元的可视化

选自MIT 机器之心编译 参与:黄小天、Smith 近日,麻省理工学院(MIT)Antonio Torralba 等人发表了一篇题为《mNeuron:...

3546
来自专栏计算机视觉战队

简单理解感受野

最近在组会讲解框架时,在感受野这个小知识点,大家开始产生歧义,今天我就简单的给大家讲解下这个小知识点,也给初学者带来一个对Receptive Field崭新的认...

2764
来自专栏ATYUN订阅号

Python机器学习的练习六:支持向量机

在这个练习中,我们将使用支持向量机(SVMs)创建一个垃圾邮件分类器。在一些简单的2D数据集上使用SVMs去观察他们如何工作,接下来我们查看一组邮件数据集,并且...

4386

扫码关注云+社区