人群密度估计--CNN-based Cascaded Multi-task Learning of High-level Prior and Density Estimation for Crowd

CNN-based Cascaded Multi-task Learning of High-level Prior and Density Estimation for Crowd Counting International Conference on Advanced Video and Signal Based Surveillance (AVSS) 2017 Torch: https://github.com/svishwa/crowdcount-cascaded-mtl

本文主要解决人群密度估计问题中的 人群场景变化大的问题,人在场景中的尺度和外观变化范围大 the issue of large variations in scale and appearance of the objects that occurs due to severe perspective distortion of the scene

本文提出的解决思路是使用 CNN网络,并在网络中嵌入 high-level prior 先验知识 The aim of this work is to learn models that cater to a wide variety of density levels present in the data set by incorporating a high-level prior into the network.

所谓的 high-level prior 就是根据图像中的大致总人数将图像分类不同的若干类,本文将图像根据总人数分为10类 The high-level prior learns to classify the count into various groups whose class labels are based on the number of people present in the image.

这个 high-level prior 可以不受 scale variations 的影响 让我们能够对图像中总人数有一个大致的估计 By exploiting count labels, the high-level prior is able to estimate coarse count of people in the entire image irrespective of scale variations thereby enabling the network to learn more discriminative global features.

3 Proposed method

我们的CNN网络前两个卷积用于提取公用特征,接着网络一分为二,一个分支是用于 High-level prior stage,这个分支主要干什么了?Classifying the crowd into several groups, quantize the crowd count into ten groups and learn a crowd count group classifier which also performs the task of incorporating high-level prior into the network

第二个分支 接着使用四个卷积层提取特征,然后再综合 上个分支的特征,使用 fractionally strided convolutions 做特征图上采样,得到大尺度的密度估计图

目标损失函数: 1) cross-entropy loss function for the high-level prior stage

2) loss function for the density estimation stage

Ground truth density map 真值密度图的生成: calculated by summing a 2D Gaussian kernel centered at every person’s location x

4 Experimental results

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

特征工程简介|机器学习

(I)特征工程可以解决什么样的问题? 特征工程是一个非常重要的课题,是机器学习中不可缺少的一部分,但是它几乎很少出现于机器学习书本里面的某一章。在机器学习方面的...

2948
来自专栏机器学习算法与Python学习

以为GAN只能“炮制假图”?它还有这7种另类用途

最近,AI方案设计师Alexandor Honchar在Medium网站上分享一篇文章。他认为生成对抗网络(GAN)目前在生成图像取得了巨大进展,生成的图像几乎...

693
来自专栏AI科技大本营的专栏

一篇文章搞懂图像风格迁移(Neural Style)的历史变迁

作者 | 李嘉铭 面向读者:没有或有一定机器学习经验并对Prisma之类的app背后的原理感兴趣的读者。比较有经验的读者可以直接参照科技树阅读文章末罗列的引用论...

3396
来自专栏人工智能头条

卷积神经网络模型如何辨识裸体图片

1865
来自专栏AI科技大本营的专栏

DeepMind到底是如何教AI玩游戏的?这篇在Medium上获得1700个赞的文章,把里面的原理讲清楚了

一篇顶十篇!想入门强化学习,专心研读这篇对DeepMind经典论文的解析就够了 作者 | Aman Agarwal 编译 | Shawn 编辑 | 鸽子、焦燕...

3256
来自专栏AI科技评论

大神Yoshua Bengio经典前瞻演讲——深度学习框架将所向披靡(51页PPT干货)

编者注:Yoshua Bengio教授是机器学习大神之一,尤其是在深度学习这个领域,他也是人工智能领域中经典之作《Learning Deep Architect...

3425
来自专栏机器之心

CoNLL 2018 | 最佳论文揭晓:词嵌入获得的信息远比我们想象中的要多得多

昨日,CoNLL 公布了最佳论文,由来自西班牙巴斯克大学 IXA NLP 组的 Mikel Artetxe 等人获得。该论文展示了词嵌入模型能够捕获不同层面的信...

581
来自专栏CreateAMind

用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践

近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类领域特别是应用深度学习解决文本分类的...

2232
来自专栏新智元

【史上最有趣论文】物体检测经典模型YOLO新升级,就看一眼,速度提升 3 倍!

【新智元导读】你肯定很少见到这样的论文,全文像闲聊一样,不愧是YOLO的发明者。物体检测领域的经典论文YOLO(You Only Look Once)的两位作者...

3218
来自专栏AI科技评论

学界 | MnasNet论文解读:终端轻量化模型新思路

AI 科技评论按,本文作者陈泰红(ahong007@yeah.net),他为 AI 科技评论撰写了关于 MnasNet 论文的独家解读文章。

681

扫码关注云+社区