人群密度估计--CrowdNet: A Deep Convolutional Network for Dense Crowd Counting

CrowdNet: A Deep Convolutional Network for Dense Crowd Counting published in the proceedings of ACM Conference on Multimedia (ACMMM) - 2016 http://val.serc.iisc.ernet.in/CrowdNet/ Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet

针对人群密度估计问题,本文使用 deep and shallow, fully convolutional networks 两个网络相结合实现 large scale variations, high-level semantic information (face/body detectors) and the low-level features (blob detectors)

我们的网络结构如下所示:

Deep Network 主要用捕获 high-level semantics 信息,这里我们采用一个类似 VGG网络的结构,我们去掉了全连接层,网络变成了全卷积层。同时原来的 VGG网络使用了5个 max-pool layers each with a stride of 2,最终的特征图大小只有输入图像尺寸的1/32。我们这里需要输出像素级别的人群密度估计图,所以我们 set the stride of the fourth max-pool layer to 1 and remove the fifth pooling layer,这样最终的特征图大小只有输入图像尺寸的 1/8.

the receptive-field mismatch caused by the removal of stride in the fourth max-pool layer 将第四最大池化层的步长设置为1会导致 the receptive-field mismatch, 这里我们使用了文献【4】中的 膨胀卷积。其结果就相当第四最大池化层的步长设置为2

Shallow Network 这里我们使用一个 shallow convolutional network 主要用于检测远离相机的人头, used for the detection of small head-blobs

Combination of Deep and Shallow Networks 这里 concatenate Deep and Shallow Networks 的输出,输入图像尺寸的 1/8, 使用一个 1x1 convolution layer, 再 upsampled to the size of the input image using bilinear interpolation to obtain the final crowd density prediction

3.2 Ground Truth generate our ground truth by simply blurring each head annotation using a Gaussian kernel normalized to sum to one

3.3 Data Augmentation 这里主要使用两类数据增强 primarily perform two types of augmentation 1)对 scale variations 我们多尺度采样

2)对容易错误的样本我们多训练几次 sampling high density patches more often

4 EXPERIMENTS

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

Assignment 3 (神经网络) | 斯坦福CS231n-深度学习与计算机视觉课程

该笔记是以斯坦福cs231n课程的python编程任务为主线,展开对该课程主要内容的理解和部分数学推导。这篇文章是第三篇。 ? CS231n简介 CS231n的...

3367
来自专栏专知

【干货】加速梯度下降的若干小技巧

【导读】在训练神经网络的时候,使用标准梯度下降法常常使网络陷入局部最小值,从而造成实验结果不佳。本文介绍了几种标准梯度下降的基础的改进算法。如批量梯度下降,正则...

36611
来自专栏AI2ML人工智能to机器学习

概率分布の三奥义

在 “免费: 大赏新书CASI” 里面斯坦福的优化大师Efron对统计的描述有一个三角形, 这个三角形的三个顶点分别是 频率派(Frequentist), 费希...

752
来自专栏目标检测和深度学习

深度学习时代的目标检测综述

1081
来自专栏新智元

机器学习模型出错的四大原因及如何纠错

【新智元导读】本文介绍了机器学习模型出错的常见原因, 讨论了如何用偏差和方差、精确率和召回率这些指标来评测模型的问题,并基于 Andrew Ng 在斯坦福机器学...

3418
来自专栏PaddlePaddle

激活函数

深度学习基础理论-CNN篇 激活函数 ? 激活函数(activation function)层又称非线性映射层,顾名思义,激活函数的引入为的是增加整个网络的...

2829
来自专栏郭耀华‘s Blog

【深度学习】深入理解Batch Normalization批标准化

1442
来自专栏目标检测和深度学习

综述:深度学习时代的目标检测算法

来源:https://zhuanlan.zhihu.com/p/33277354 目前目标检测领域的深度学习方法主要分为两类:two stage的目标检测算法;...

3875
来自专栏CreateAMind

torcs强化学习的图像生成低纬表示重建效果

commaai的生成模型进行生成torcs道路画面,左侧为生成图像,右侧为实际游戏图像,两个画面为一个epoch的1万次循环训练的效果,下面跨度98个epoch...

924
来自专栏人工智能LeadAI

监督学习中各算法优缺点及应用场景概览

记录一波监督学习算法的应用场景和优缺点。 高斯朴素贝叶斯 场景:该模型常用于性别分类(https://en.wikipedia.org/wiki/Naive_B...

4476

扫码关注云+社区