我使用下面给出的源代码中的代码来获取最近的“站点”。根据他们的解释,这应该是可行的。为了验证这个数据,我使用.describe()获得了一些统计数据,它告诉我教程方法确实给出了一个比实际数据中的距离更接近的平均距离(792m vs实际距离1.80 km)。Closest Distance generated using the BallTree method Actual Distance in t
从纬度/经度数据开始(以弧度计),我试图有效地找到最近的n个邻居,最好是测地距离(WGS-84)。现在我使用的是和haversine距离(KD-Tres只使用minkowskian距离),这是很好的和快速的(3-4秒来为7500个可能的匹配中的1200个位置找到最近的5个邻居),但没有我所需要的那么精确代码:
tree = BallTree(possib
我有一个细长的数据矩阵(大小: 250,000 x 10),我将其命名为X。我还有一个矢量p来测量我的数据点的质量。我的目标是为数据矩阵X中的每一行x计算以下函数在较小的数据集上,我将使用sklearn.metrics.pairwise_distancesmetrics.pairwise_distances(X);for i in range(n):
r[i] =