Counting Varying Density Crowds Through Attention Guided Detection and Density Estimation CVPR2018 本文针对人群密度问题 将 检测方法和回归方法结合到一起,以此来提升人群密度估计精度 人群密度估计问题目前主要的方法有基于检测的和基于回归的方法。 在人群密度小的时候,基于检测的方法效果更好。在人群密度较大的时候,基于回归方法的效果比较好。 ? ? 本文的思路就是将 检测方法和回归方法结合起来,各取所长。
该网络在几个常用的公开人群密度估计数据库上取得了不错的效果。 1 Introduction 拥挤场景解析的发展从简单的人群数值估计到 人群密度图估计,人群密度图可以提供额外的信息,因为同样数量的人可以分布在不同的位置,如下图所示 ? 生成准确的人群分布图挑战性比较大,其中一个主要的困难就是离散化的问题,人在图像中不是只占用一个像素,密度图需要保持局部邻域的连续性。其他的困难包括场景的多样性,相机角度的多样性。 以前基于CNN网络的人群密度估计主要采用了 multi-scale architectures,虽然取得了不错的性能,但是存在两个问题:当网络变深的时候, the large amount of training 人群密度估计从方法上来说可以分为三大类:detection-based methods, regression-based methods, and density estimation-based methods
想听听你玩转的独门秘籍,更有机械键盘、鹅厂公仔、CODING 定制公仔等你来拿!
Learning to Count with CNN Boosting ECCV2016 本文使用CNN来进行人群密度估计,主要有两个改进地方:layered boosting and selective CNNs 根据图像目标的位置,一般使用一个 normalized 2D Gaussian kernel 生成真值密度图,对于行人我们使用了一个 specific smoothing kernel 人群密度图
Spatiotemporal Modeling for Crowd Counting in Videos ICCV2017 针对视频人群密度估计问题,这里主要侧重视频中的 temporal information ,使用 convolutionalLSTM(ConvLSTM) 的一个变体 a bidirectional ConvLSTM model 来提取当前帧的前后帧信息提升人群密度估计 当前基于回归方法的人群计数取得不错的效果 它们将人群计数问题看作一个回归问题,通过学习一个回归函数或映射,将一些整体或局部特征映射到一个人群总数或人群密度图。线性回归、高斯过程回归、神经网络都可以用过回归模型。 当前人群计数最好的算法基本都是采用回归方法的。 3 Our Crowd Counting Method 3.1. Crowd density map 这里我们采用估计人群密度图,因为它包含的信息更多一些。
Crowd Counting by Learning to Rank CVPR2018 https://github.com/xialeiliu/CrowdCountingCVPR18 本文针对人群密度估计训练数据库规模很小的问题 提出了使用未标定数据来 self-supervised,具体通过 Learning to Rank 人群密度估计数据库规模很小的主要原因是 图像标记工作量很大,需要将图像中密集人群每个人头标记出来。 context-aware models 主要学习图像中的context,文献[12,31]将图像块根据人群密度大小 分为5个等级 very high density, high density, medium Crowd density estimation network 人群密度估计网络,这里我们使用 VGG16网络,利用预训练网络模型参数可以提升网络的人群密度估计性能 ? 4.2. Combining counting and ranking data 这里主要介绍了三种将 排序数据嵌入到人群密度估计的方式 ? 5 Experiments 误差度量公式 ?
val.serc.iisc.ernet.in/CrowdNet/ Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet 针对人群密度估计问题 我们这里需要输出像素级别的人群密度估计图,所以我们 set the stride of the fourth max-pool layer to 1 and remove the fifth pooling
International Conference on Computer Vision Theory and Applications (VISAPP) VISAPP 2017 本文使用 FCN 来做人群密度估计 network, 主要改进的地方有以下三点:1)新的数据增强方法用于增加训练数据;2)提出一个更好的FCN网络;3)输入图像的多尺度用于解决 scale and perspective FCN 用于人群计数主要的优点就是输入图像尺寸可以是任意的 这里主要是根据人头位置信息得到人群密度真值图。 Gaussian kernel G σi is applied for each head annotation 2.1 Training Set Augmentation Scheme 由于大多数人群计数方面的数据库规模都比较小 2.3 Multi-Scale Averaging During Inference 我们对输入的测试图像使用多尺度输入,得到更好的密度估计,original size + 80% original
Structured Inhomogeneous Density Map Learning for Crowd Counting https://arxiv.org/abs/1801.06642 针对人群密度估计问题 ,本文分析了当前基于密度估计问题算法存在的问题, inhomogeneous density distribution problem,随后提出解决这个问题的方法,将密度图由2D 拓展到 3D,网络具体实现由 Problem Formulation 这问题的描述中介绍了人群密度估计问题是如何由标记图像变为人群密度图,以及将密度估计问题变为回归问题,设计损失函数 B. 对此文献数据就可以知道了 b) DNNs 相对于 shallow networks 表现的更差,尤其是在 人群密度差异较大的数据库上( especially on datasets with various
arxiv.org/abs/1711.04433v2 Code: https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu 为了解决人群密度估计中的
Learning a perspective-embedded deconvolution network for crowd counting 没有找到代码 本文在人群密度估计这个问题上的创新点: 在人群图像中的表现就是离相机远的人其在图像中就显得比较小,离相机比较近的人其在图像中显得比较大。
Multi-scale Convolutional Neural Networks for Crowd Counting https://arxiv.org/abs/1702.02359 对于人群密度估计问题
Generating High-Quality Crowd Density Maps using Contextual Pyramid CNNs ICCV2017 针对人群密度估计问题,本文主要从 incorporating global and local contextual information 来降低人群密度估计误差 使用多个CNN网络来估计不同尺度的 context 来帮助人群密度估计 密度估计方法主要学习 local patch features and density maps 之间的映射关系 CNN-based methods 尝试各种 CNN网络来完成 人群总数估计和人群密度图生成 ,而不是侧重人群密度图的质量 3)当前的 CNN 网络基本都是使用 像素级欧式损失函数来训练网络,这导致密度图比较模糊。 Local Context Estimator (LCE) 当前的人群密度估计方法更侧重于降低人群总数估计的误差,所以它们的人群密度图质量相对降低,我们相信 some kind of local
Signal Based Surveillance (AVSS) 2017 Torch: https://github.com/svishwa/crowdcount-cascaded-mtl 本文主要解决人群密度估计问题中的 人群场景变化大的问题,人在场景中的尺度和外观变化范围大 the issue of large variations in scale and appearance of the objects into the network 第二个分支 接着使用四个卷积层提取特征,然后再综合 上个分支的特征,使用 fractionally strided convolutions 做特征图上采样,得到大尺度的密度估计图
核密度估计就是属于该策略,全称为Kernel Density Estimation,缩写为KDE 对于数据分布,最简单的做法就是绘制直方图了,示例如下 ? 相比直方图,核密度估计通过离散样本点来的线性加和来构建一个连续的概率密度函数,从而得到一个平滑的样本分布,以一维数据为例,核密度估计的公式如下 ? 在sickit-learn中, 提供了多种核函数来进行核密度估计,图示如下 ? 对于不同的核函数而言,虽然会有一定的影响,但是效果没有h参数的影响大,示例如下 ?
但是通常我们是不知道一个随机变量的PDF的,因此我们需要不断去逼近这个PDF,而逼近的这个过程就是概率密度估计。 graph LR A[概率密度函数] -->|描述| B(概率密度) C[概率密度估计] -->|估计| A(概率密度函数) 在对随机变量进行密度估计的过程中,需要执行几个步骤。 这种情况下参数密度估计变得不好使,所以非参数密度估计登场了。 其实非参数密度估计还是有参数的,只不过这个参数和参数密度估计中的参数有所不同。 而非参数密度估计其实是使用所有样本来进行密度估计,换句话说每个样本的观测值都被视为参数。 下面也给出一个例子来从直观上来理解非参数密度估计。 下面是当我们设置不同bins值时的两个直方图。可以看到左边有两个峰,右边只有一个。
但是通常我们是不知道一个随机变量的PDF的,因此我们需要不断去逼近这个PDF,而逼近的这个过程就是概率密度估计。 graph LR A[概率密度函数 \] -->|描述 \| B(概率密度 \) C[概率密度估计 \] -->|估计 \| A(概率密度函数 \) 在对随机变量进行密度估计的过程中,需要执行几个步骤 需要注意的是,有的时候我们所观测到的数据并不显示地服从某个已知分布,因此通常我们需要先对数据做一定的变换,之后再来做参数密度估计。 这种情况下参数密度估计变得不好使,所以非参数密度估计登场了。 其实非参数密度估计还是有参数的,只不过这个参数和参数密度估计中的参数有所不同。 而非参数密度估计其实是使用所有样本来进行密度估计,换句话说每个样本的观测值都被视为参数。
一、数据源 1、相似人群数据存在TDW库中,数据字典说明: CREATE TABLE sim_people_tdw_tbl( uid STRING COMMENT 'reader id', ', update_date STRING COMMENT 'update_date' ) 字段 类型 含义 uid string 用户标识 sim_uids string 与uid喜好相似的人群 ,格式为用户编号:相同阅读量,相似用户之间以逗号分隔 sim_num BIGINT 相似人群的人数 update_date string 数据日期 2、基础用户画像存在MongoDB中 Image [ 相似人群字典表 :return: 相似度最高的相似人群 """ user_similarity_list = sorted(cluster_dic.iteritems(), key : 相似人群的相似度字典表 :return: 相似人群画像字典表 """ cluster_profile_rs = {} for sim_user_obj in sim_users_profile_array
提供汽车垂直行业人群洞察和线索预测服务,助力车企精准营销与投放,通过腾讯汽车精准营销服务,帮助车企实现数字营销降本增效。
扫码关注腾讯云开发者
领取腾讯云代金券