人群密度估计--Crowd Counting Via Scale-adaptive Convolutional Nerual Network

Crowd Counting Via Scale-adaptive Convolutional Nerual Network https://arxiv.org/abs/1711.04433v2 Code: https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu

为了解决人群密度估计中的 scale and perspective 问题,先前研究者提出使用 多尺度卷积网络来解决多尺度问题 Multiple columns have different receptive fields corresponding to pedestrians (heads) of different scales 这里我们提出一个 尺度自适应CNN网络,只使用 3 ∗ 3 滤波器,结合CNN网络不同网络层的特征 a scale-adaptive CNN (SaCNN) architecture with a backbone of fixed small receptive fields. We use all 3 ∗ 3 filters in the network

输入输出图示

3 Scale-adaptive CNN 3.1. Ground truth density maps 每个人头我们使用一个 delta function 来表示,ground truth density map D(x) 由 delta function 和 一个 Gaussian kernel 卷积得到

N 表示图像中人头总数, The sum of the density map is equivalent to the total number of pedestrians in a crowd

3.2. Network architecture

The final density map therefore has a spatial resolution of 1/8 times of the input image.

3.3. Network loss Euclidean loss to measure the distance between the estimated density map and the ground truth

引入了一个新的损失函数,侧重于 解决图像中只有几个人的情况估计效果不好的问题 introduce another loss function regarding the head count We notice that most representative approaches perform poorly on crowd scenes with few pedestrians. 原来的损失函数不能解决这个问题的原因:because the absolute pedestrian number is usually not very large in sparse crowds compared to that in dense crowds

4 Experiments

我们的新数据库:特点 人少

ShanghaiTech dataset

WorldExpo’10 dataset & UCF CC 50 dataset

SmartCity dataset

下面是和 YOLO9000 对比,各有所长

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

教程 | 详解如何使用Keras实现Wassertein GAN

选自Deeply Random 机器之心编译 参与:晏奇、李泽南 在阅读论文 Wassertein GAN 时,作者发现理解它最好的办法就是用代码来实现其内容。...

38110
来自专栏深度学习入门与实践

【原】文本挖掘——特征选择

特征选择有很多方法,看了很多资料后,我总结了以下几种,以后有新内容会随时修改 1.DF——基于文档频率的特征提取方法 概念:DF(document freque...

1885
来自专栏Petrichor的专栏

深度学习: VGGNet 网络

VGGNet 于2014年由牛津大学著名研究组VGG (Visual Geometry Group) 提出,斩获该年ImageNet竞赛中 Localizati...

993
来自专栏Python中文社区

深度学习入门:用MNIST完成Autoencoder

專 欄 ❈那只猫,Python中文社区专栏作者,Python中文社区新Logo设计人,纯种非CS科班数据分析人,沉迷Keras。在Cambridge做了点小事...

1956
来自专栏机器之心

深度 | 级联MobileNet-V2实现人脸关键点检测(附训练源码)

机器之心投稿 作者:余霆嵩 为了能在移动端进行实时的人脸关键点检测,本实验采用最新的轻量化模型——MobileNet-V2 作为基础模型,在 CelebA 数据...

4265
来自专栏计算机视觉战队

结合人类视觉注意力进行图像分类

注:昨天推送发现内容有一个严重错误,所以临时删除了文章的链接,希望关注的您能够谅解,我们也是希望推送最完整最准确的内容,谢谢您的支持与关注,谢谢! 好久没有和大...

4176
来自专栏专知

深度学习TensorFlow实现集合

【导读】该项目使用Tensflow实现了一些一些深度学习的算法,帮助新手更快的上手。

521
来自专栏算法channel

机器学习:XGBoost 安装及实战应用

《实例》阐述算法,通俗易懂,助您对算法的理解达到一个新高度。包含但不限于:经典算法,机器学习,深度学习,LeetCode 题解,Kaggle 实战。期待您的到来...

3947
来自专栏贾志刚-OpenCV学堂

AlexNet网络的结构详解与实现

在2012年ImageNet图像分类任务竞赛中AlexNet一鸣惊人,对128万张1000个分类的预测结果大大超过其他算法模型准确率,打败其它非DNN网络一鸣惊...

734
来自专栏机器之心

资源 | DanceNet:帮你生成会跳舞的小姐姐

DanceNet 中最主要的三个模块是变分自编码器、LSTM 与 MDN。其中变分自编码器(VAE)是最常见的生成模型之一,它能以无监督的方式学习复杂的分布,因...

724

扫码关注云+社区