我有两个关于分析GPS数据集的问题。
1)提取轨迹----我有一个巨大的数据库,记录了(latitude, longitude, date-time)格式的全球定位系统坐标。根据连续记录的日期时间值,我试图提取人所遵循的所有轨迹/路径。例如,如果从time M开始,(x,y)对一直在变化,直到time N为止。在N之后,(x,y)对的变化减少,在这一点上,我得出结论,从时间M到N的路径可以称为轨迹。在提取轨迹时,这是一种很好的方法吗?有什么著名的方法/方法/算法你可以建议吗?是否有任何数据结构或格式,您想建议我以有效的方式维护这些点?也许,对于每条轨道,计算出速度和加速度是有用的吗?
2)挖掘轨迹,一旦所有的轨迹都遵循/路径,我如何比较/聚类它们?我想知道起点或终点是相似的,那么中间路径是如何比较的呢?
我如何比较这两条路径/路线,并得出结论,如果它们是否相似。此外,我如何将相似的路径聚在一起?
如果你能向我介绍一项关于这个问题的研究或类似的事情,我会非常感激的。
该开发将在Python中进行,但欢迎各种库建议。
提前谢谢。
发布于 2011-02-06 22:27:24
看看苏黎世大学地理系所做的工作,特别是帕特里克·劳贝和Somayeh Dodge。
看一看报纸
个人移动与地理数据挖掘。用于突出个人导航路径热点的聚类算法
(链接,介绍性)。介绍了DBSCAN核密度估计方法在GPS数据中的应用。
另外,诺基亚2012年移动数据挑战讲习班的论文在这里也会有所帮助,尤其是:
MobReduce:降低移动跟踪的状态复杂性(链接)
作者Fabian Hartmann,Christoph P. Mayer,Ingmar Baumgart和
轨迹聚类的轨迹清理框架(链接)
Agzam Idrissov,Mario A. Nascimento,Alberta大学
发布于 2011-02-07 08:33:40
1)提取轨迹--我认为你的方向是正确的。gps数据中可能会有一些噪声,随机行走,你应该做一些平滑的样条来克服它。
( 2)挖掘轨迹,相似轨迹是否有商业意义?(这将有助于建立距离度量,然后您可以使用一些mahoot聚类算法) 1.我认为一些被停职的人更感兴趣,因此您可以为位置的流行生成统计数据。2.如果需要路径相似性来找到同一起始端的不同路径,则需要先对起始端位置进行聚类,然后根据相似的曲线(最大距离--积分距离--一些众所周知的功能度量)进行聚类。
https://stackoverflow.com/questions/4910510
复制相似问题