我是Python编码的初学者,我正在尝试使用DBSCAN算法来识别城市中具有高密度闪烁照片的区域。是否有确定DBSCAN(eps,min_samples)参数的标准?
谢谢
发布于 2021-04-22 15:07:17
解释如何选择这些参数的guide。
摘自指南:
根据DBSCAN算法的originators (Ester,Kriegel,Sander和Xu,1996),我们可以使用这个启发式算法来找到MinPts和ε:对于给定的k,我们构建排序的k-dist图(您可以在指南中了解它)。阈值是排序k-dist图的第一个“谷”中的第一个点。阈值的k-dist值将是ε值。研究表明,k>4的k-dist图与4-dist图没有显着差异,它们需要相当多的计算量。因此,对于所有数据库(对于二维数据),他们通过将参数MinPts设置为4来消除该参数。阈值的4-dist值用作DBSCAN的ε值。
如果您不希望维度的值为4,您可以决定MinPts = k+1。选择k的启发式方法是将k设置为2∗-1 (Sander,Ester et al.,1998)。
选择MinPts值的另一个启发式方法-
其中Pᵢ是点i的ε邻域中的点数,n是数据集中的点数。对于每个不同的ε值,我们将获得相应的MinPts值(Sawant,2014)。
https://stackoverflow.com/questions/65719972
复制相似问题