专栏首页arxiv.org翻译专栏一种通过移动数据发现日常人类出行方式的概率方法(CS LG)
原创

一种通过移动数据发现日常人类出行方式的概率方法(CS LG)

近年来,从智能手机用户那里收集的地理位置数据来发现人们的出行方式一直是研究的热点。在本文中,我们尝试根据GPS数据发现每日的移动模式。我们从概率的角度来看这个问题,以便与其他常规方法相比从原始GPS数据中探索更多信息。一种非参数贝叶斯建模方法,即无限高斯混合模型,用于估计日移动性的概率密度。然后,我们使用Kullback-Leibler散度作为度量标准来衡量不同概率分布的相似性。结合无限高斯混合模型和Kullback-Leibler散度,我们推导了一种自动聚类算法,可以发现每个用户的移动性模式而无需事先设置聚类数。在实验中,我们的方法的有效性在从不同用户收集的真实用户数据上得到了验证。结果表明,基于IGMM的算法优于基于GMM的算法。我们还对具有不同长度的数据集测试了我们的方法,以发现用于发现移动性模式的最小数据长度。

原文题目:A Probabilistic Approach for Discovering Daily Human Mobility Patterns with Mobile Data

原文:Discovering human mobility patterns with geo-location data collected from smartphone users has been a hot research topic in recent years. In this paper, we attempt to discover daily mobile patterns based on GPS data. We view this problem from a probabilistic perspective in order to explore more information from the original GPS data compared to other conventional methods. A non-parameter Bayesian modeling method, Infinite Gaussian Mixture Model, is used to estimate the probability density for the daily mobility. Then, we use Kullback-Leibler divergence as the metrics to measure the similarity of different probability distributions. And combining Infinite Gaussian Mixture Model and Kullback-Leibler divergence, we derived an automatic clustering algorithm to discover mobility patterns for each individual user without setting the number of clusters in advance. In the experiments, the effectiveness of our method is validated on the real user data collected from different users. The results show that the IGMM-based algorithm outperforms the GMM-based algorithm. We also test our methods on the dataset with different lengths to discover the minimum data length for discovering mobility patterns.

原文作者:Weizhu Qian, Fabrice Lauri, Franck Gechter

原文地址:https://arxiv.org/abs/1911.09355

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 楼宇自动化系统中基于模糊巡逻机器人的开发(CS AI)

    楼宇自动化系统(BAS)具有监视和控制所有楼宇子系统运行的功能,如暖通空调(暖通空调控制)、用电管理、火警控制、保安和门禁控制以及电器开关控制。在BAS中,几乎...

    小童
  • 约束机器学习的正则化方法分析(CS ML)

    引入了基于正则化的机器学习(ML)注入约束方式,以通过专家知识来改进预测模型。我们解决了在loss(学习者的准确性)和正则化项(约束满足度)之间找到平衡的问题。...

    小童
  • 在犯罪会话数据中使用网络知识改善说话人识别(CS SI)

    刑事调查依赖于对话数据的收集。必须评估说话者的身份,以建立或改善现有犯罪网络的准确性。研究人员使用社交网络分析工具来识别网络中最核心的人物和不同社区。我们介绍犯...

    小童
  • Ceph用户邮件列表Vol45-Issue3

    https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=af5e5...

    用户2772802
  • 原创译文 | 比特币暴跌,源自又一个加密货币交易所被黑客攻击

    几天前韩国加密货币交易所Coinrail受到黑客攻击,之后,比特币以及其他几种虚拟货币的价格一路下跌。

    灯塔大数据
  • 欠驱动空间车辆在非参数化路径下的鲁棒输出反馈VFO-ADR控制

    本文研究了欠驱动车辆在三维空间运动时的矢量场定向自抗扰(vfoadr)级联路径跟踪控制器。级联控制结构的概念将系统运动学与系统动力学解耦,类似于非完整系统的方法...

    非过度曝光
  • 【CodeForces 602C】H - Approximating a Constant Range(dijk)

    In Absurdistan, there are n towns (numbered 1 through n) and m bidirectional rai...

    饶文津
  • universe-starter-agent

    The codebase implements a starter agent that can solve a number of universe envi...

    用户1908973
  • IOS5开发-控件位置适应屏幕旋转代码

    - (void)willRotateToInterfaceOrientation:(UIInterfaceOrientation)toOrientation  ...

    阿新
  • Playrix Codescapes Cup (Codeforces Round #413, rated, Div. 1 + Div. 2)(A.暴力,B.优先队列,C.dp乱搞)

    A. Carrot Cakes time limit per test:1 second memory limit per test:256 megabytes...

    Angel_Kitty

扫码关注云+社区

领取腾讯云代金券