人群密度估计--Crowd Counting Via Scale-adaptive Convolutional Nerual Network

Crowd Counting Via Scale-adaptive Convolutional Nerual Network https://arxiv.org/abs/1711.04433v2 Code: https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu

为了解决人群密度估计中的 scale and perspective 问题,先前研究者提出使用 多尺度卷积网络来解决多尺度问题 Multiple columns have different receptive fields corresponding to pedestrians (heads) of different scales 这里我们提出一个 尺度自适应CNN网络,只使用 3 ∗ 3 滤波器,结合CNN网络不同网络层的特征 a scale-adaptive CNN (SaCNN) architecture with a backbone of fixed small receptive fields. We use all 3 ∗ 3 filters in the network

输入输出图示

3 Scale-adaptive CNN 3.1. Ground truth density maps 每个人头我们使用一个 delta function 来表示,ground truth density map D(x) 由 delta function 和 一个 Gaussian kernel 卷积得到

N 表示图像中人头总数, The sum of the density map is equivalent to the total number of pedestrians in a crowd

3.2. Network architecture

The final density map therefore has a spatial resolution of 1/8 times of the input image.

3.3. Network loss Euclidean loss to measure the distance between the estimated density map and the ground truth

引入了一个新的损失函数,侧重于 解决图像中只有几个人的情况估计效果不好的问题 introduce another loss function regarding the head count We notice that most representative approaches perform poorly on crowd scenes with few pedestrians. 原来的损失函数不能解决这个问题的原因:because the absolute pedestrian number is usually not very large in sparse crowds compared to that in dense crowds

4 Experiments

我们的新数据库:特点 人少

ShanghaiTech dataset

WorldExpo’10 dataset & UCF CC 50 dataset

SmartCity dataset

下面是和 YOLO9000 对比,各有所长

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

如何使用注意力模型生成图像描述?

我们的目标是用一句话来描述图片, 比如「一个冲浪者正在冲浪」。 本教程中用到了基于注意力的模型,它使我们很直观地看到当文字生成时模型会关注哪些部分。

1412
来自专栏Gaussic

使用TensorFlow训练循环神经网络语言模型

读了将近一个下午的TensorFlow Recurrent Neural Network教程,翻看其在PTB上的实现,感觉晦涩难懂,因此参考了部分代码,自己写了...

1513
来自专栏MixLab科技+设计实验室

用谷歌新开源的deeplearnJS预测互补颜色

本文翻译自deeplearnJS的示例教程,并结合了我在学习过程中的理解。 deeplearnJS简介: deeplearn.js是用于机器学习的开源WebGL...

2928
来自专栏从流域到海域

How to Use the TimeDistributed Layer for Long Short-Term Memory Networks in Python 译文

How to Use the TimeDistributed Layer for Long Short-Term Memory Networks in Pyth...

49212
来自专栏人工智能LeadAI

用CNN做句子分类:CNN Sentence Classification (with Theano code)

01 Intro 本篇文章来细说CNN在NLP中的一大应用————句子分类。通过Yoon Kim的论文介绍一个应用,分析代码,并重构代码。 重构后的代码放在gi...

6005
来自专栏Python数据科学

一款非常棒的特征选择工具:feature-selector

本篇主要介绍一个基础的特征选择工具feature-selector,feature-selector是由Feature Labs的一名数据科学家williamk...

1214
来自专栏人工智能LeadAI

ResNet原理及其在TF-Slim中的实现

摘要 微软的深度残差网络ResNet源于2016年CVPR最佳论文---图像识别中的深度残差学习(Deep Residual Learning for Imag...

4484
来自专栏人工智能

从程序员的角度设计一个Java的神经网络

用Java或任何其他编程语言设计神经网络我们需要理解人工神经网络的结构和功能。

1.3K10
来自专栏IT派

一文带你入门Tensorflow

导语:此文编译自FCC(FreeCodeCamp),作者为Déborah Mesquita,该作者利用神经网络和TensorFlow进行了机器文本分类,并提出了...

4219
来自专栏小鹏的专栏

01 TensorFlow入门(2)

Working with Matrices:         了解TensorFlow如何使用矩阵对于通过计算图理解数据流非常重要。 Getting read...

2446

扫码关注云+社区