专栏首页机器学习、深度学习人群密度估计--CrowdNet: A Deep Convolutional Network for Dense Crowd Counting

人群密度估计--CrowdNet: A Deep Convolutional Network for Dense Crowd Counting

CrowdNet: A Deep Convolutional Network for Dense Crowd Counting published in the proceedings of ACM Conference on Multimedia (ACMMM) - 2016 http://val.serc.iisc.ernet.in/CrowdNet/ Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet

针对人群密度估计问题,本文使用 deep and shallow, fully convolutional networks 两个网络相结合实现 large scale variations, high-level semantic information (face/body detectors) and the low-level features (blob detectors)

我们的网络结构如下所示:

Deep Network 主要用捕获 high-level semantics 信息,这里我们采用一个类似 VGG网络的结构,我们去掉了全连接层,网络变成了全卷积层。同时原来的 VGG网络使用了5个 max-pool layers each with a stride of 2,最终的特征图大小只有输入图像尺寸的1/32。我们这里需要输出像素级别的人群密度估计图,所以我们 set the stride of the fourth max-pool layer to 1 and remove the fifth pooling layer,这样最终的特征图大小只有输入图像尺寸的 1/8.

the receptive-field mismatch caused by the removal of stride in the fourth max-pool layer 将第四最大池化层的步长设置为1会导致 the receptive-field mismatch, 这里我们使用了文献【4】中的 膨胀卷积。其结果就相当第四最大池化层的步长设置为2

Shallow Network 这里我们使用一个 shallow convolutional network 主要用于检测远离相机的人头, used for the detection of small head-blobs

Combination of Deep and Shallow Networks 这里 concatenate Deep and Shallow Networks 的输出,输入图像尺寸的 1/8, 使用一个 1x1 convolution layer, 再 upsampled to the size of the input image using bilinear interpolation to obtain the final crowd density prediction

3.2 Ground Truth generate our ground truth by simply blurring each head annotation using a Gaussian kernel normalized to sum to one

3.3 Data Augmentation 这里主要使用两类数据增强 primarily perform two types of augmentation 1)对 scale variations 我们多尺度采样

2)对容易错误的样本我们多训练几次 sampling high density patches more often

4 EXPERIMENTS

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 图像拼接

    Construction and Refinement of Panoramic Mosaics with Global and Local Alignment...

    用户1148525
  • 语义分割--Loss Max-Pooling for Semantic Image Segmentation

    Loss Max-Pooling for Semantic Image Segmentation CVPR2017 https://arxiv.org/...

    用户1148525
  • 语义分割--Efficient Deep Models for Monocular Road Segmentation

    Efficient Deep Models for Monocular Road Segmentation code: https://lmb.inform...

    用户1148525
  • TW洞见 | 改善结对编程体验的十个办法

    从专业和个人的角度出发,你上次体验到既高效又很有收获的结对编程是什么时候的事了?我们也很想知道,为什么很多次我们有一些特殊的结对体验并不是我们预期的那样愉快和有...

    ThoughtWorks
  • 【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

    【导读】专知内容组整理了最近六篇目标跟踪(Object Tracking)相关文章,为大家进行介绍,欢迎查看! 1. A Twofold Siamese Net...

    WZEARW
  • CRNN论文翻译——中英文对照

    声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! An End-to-End Trainable Neural Network for Image...

    Tyan
  • Going Deeper with Convolutions——GoogLeNet论文翻译——中英文对照

    声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢! Going Deeper with Convolutions Abstract We propo...

    Tyan
  • Introduction to Model Driven Development with AndroMDA

    Introduction AndroMDA (pronounced "Andromeda") is a free and open source extensi...

    张善友
  • Miguel de Icaza 细说 Mix 07大会上的Silverlight和DLR

    Mono之父Miguel de Icaza 详细报道微软Mix 07大会上的Silverlight和DLR ,上面还谈到了Mono and Silverligh...

    张善友
  • 随机梯度下降之——SGD自适应学习率

    http://ruder.io/optimizing-gradient-descent/index.html#gradientdescentvariants

    种花家的奋斗兔

扫码关注云+社区

领取腾讯云代金券