对于聚类点,我使用dbscan,因为我的点超过100万,我也使用r*-tree。
我在命令行中使用ELKI:
java -cp elki.jar
de.lmu.ifi.dbs.elki.application.KDDCLIApplication
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-algorithm clustering.DBSCAN
-dbc.in points1.txt
-dbscan.epsilon 20
-dbscan.minpts 10
-out results3/DBSCANeps20min10
对于小文件,它是正常的,但对于400万个文件,发生了错误:
at de.lmu.ifi.dbs.elki.database.ids.integer.DoubleIntegerArrayQuickSort.quickSort(Unknown Source)
发布于 2015-06-19 08:14:31
这是一个已知的错误,在一个旧版本的的ELKI,当有许多重复的距离。
可以通过更新到当前版本来解决这个问题。
https://stackoverflow.com/questions/30899639
复制相似问题