人群计数--Single-Image Crowd Counting via Multi-Column Convolutional Neural Network

Single-Image Crowd Counting via Multi-Column Convolutional Neural Network CVPR2016 https://github.com/svishwa/crowdcount-mcnn https://github.com/leeyeehoo/Reduplication-of-Single-Image-Crowd-Counting-via-MCNN-on-UCF-Dataset

对图像和视频中的人数进行精确估计在公共安全中存在着实际需求。2015年上海发生的踩踏事件很直接的说明了实时人群计数的重要性。 针对该问题,首先回顾了一下传统算法的主要发展历程。最后说了一下使用CNN解决这个问题的文献。

针对基于单张图像人群计数的问题,主要面临如下三个挑战: 1)前景分割对于大多数人群计数算法是必不可少的步骤,但是前景分割本身就是一个很难的问题,目前还没有有效的解决方法。所以我们的计数算法必须不需要前景分割 2)实际图像中人群密度和分布的明显变化及图像中严重的遮挡 导致传统基于检测的算法不能很好的对这些图像进行计数 3)我们需要将图像中不同尺度的特征综合利用

本文的贡献有如下三点: 1)使用了一个 multi-column 架构 对用不同感受野尺寸,可以处理大的 variation 2)MCNN 采用全卷积网络,输入可以是任意尺寸 3)我们建了一个新的数据库 Shanghaitech,包括 Part A and Part B

2 Multi-column CNN for Crowd Counting 2.1. Density map based crowd counting 使用CNN对输入图像进行人数统计有两种策略:1)输入图像,输出人数估计 the estimated head count,2)输出一个人群密度估计图,然后通过积分得到人数。这里我们选择第二个策略,原因如下: 1)密度图保留更多的信息,相对于一个数值,密度图给出了人群在图像中的空间分布信息,可以进行局部区域的分析。 2)学习密度图的CNN中的滤波器能够更好的适应多尺寸的人头。

2.2. Density map via geometry-adaptive kernels 这里首先来介绍怎么从有人头标记的图像得到人群密度图。 如果一个像素 x 属于一个人头,那么我们使用一个 delta function 来表示,图像中N个人头数可以用 N个 delta function 求和函数 H(x) 表示。为了将 H(x) 转变为 连续的密度函数,我们使用一个高斯核 G 和 H(x) 进行卷积F(x) = H(x) ∗ G σ (x),这么做有个前提假设就是每个 x 都是独立的,但实际不是如此。 to accurately estimate the crowd density F, we need to take into account the distortion caused by the homography between the ground plane and the image plane

这里我们主要通过设计高斯核中合适的 方差来解决这个问题。 we should determine the spread parameter σ based on the size of the head for each person within the image

图像密度图实例

2.3. Multi-column CNN for density map estimation 针对图像中人头尺寸的多样性,我们设计了不同尺寸的滤波器来提取不同尺度的特征信息

损失函数定义如下:

各个数据库的比较

估计的密度图和真值密度图对比:

Comparing performances of different methods on Shanghaitech dataset

UCF CC 50 dataset

UCSD dataset

the WorldExpo’10 crowd counting dataset

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

干货 | 目标检测入门,看这篇就够了(下)

? 作者 | 李家丞( 同济大学数学系本科在读,现格灵深瞳算法部实习生) 近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,本系列文...

5747
来自专栏AI科技大本营的专栏

盘点|最实用的机器学习算法优缺点分析,没有比这篇说得更好了

推荐理由 对于机器学习算法的盘点,网上屡见不鲜。但目前,还没人能结合使用场景来把问题说明白,而这一点正是本文的目的所在。 在文章中,作者将结合他的实际经验...

4347
来自专栏量子位

一文看懂如何搭建AI应用:10周学会深度学习,还赢下5千美元

春节后第一个休息日,量子位给大家准备了一个不一样的故事。 在这个故事里,主人公David Brailovsky(就叫阿D吧)参加了一场计算机视觉比赛。这个挑战赛...

1805
来自专栏AI科技评论

语义分割领域开山之作:Google提出用神经网络搜索实现语义分割

AI 科技评论按:本文作者陈泰红,邮箱 ahong007@yeah.net,他为 AI 科技评论撰写了 Google 利用神经网络搜索实现语义分割的独家解读。

841
来自专栏人人都是极客

干货 | 目标检测入门,看这篇就够了(下)

作者 | 李家丞( 同济大学数学系本科在读,现格灵深瞳算法部实习生) 近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,本系列文章将回顾...

4144
来自专栏机器学习、深度学习

人群密度估计--CNN-based Cascaded Multi-task Learning of High-level Prior and Density Estimation for Crowd

CNN-based Cascaded Multi-task Learning of High-level Prior and Density Estimatio...

2435
来自专栏CVer

[计算机视觉论文速递] 2018-03-20

通知:这篇推文有13篇论文速递信息,涉及图像分割、SLAM、显著性、深度估计、车辆计数等方向 往期回顾 [计算机视觉] 入门学习资料 [计算机视觉论文速递] ...

4758
来自专栏超然的博客

Context-Aware Network Embedding for Relation Modeling

论文:http://www.aclweb.org/anthology/P17-1158

1191
来自专栏Python爱好者

白话深度学习与TensorFlow(一)

2207
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

使用局部标准差实现图像的局部对比度增强算法。

      图像的对比度增强算法在很多场合都有着重要的应用,特别是在医学图像上,这是因为在众多疾病的诊断中,医学图像的视觉检查时很有必要的。而医学图像由于本身及...

2559

扫码关注云+社区