我已经使用Weka.It对一组文本文档进行了聚类,将相似的文档分组到一个集群中。我想测量cluster.How中文本文档之间的距离,以计算集群中文档之间的距离。
任何人请帮帮我,我是数据挖掘的新用户。
发布于 2016-12-07 20:41:10
这是我的simpleKmeans聚类算法代码:
EuclideanDistance Dist = weka.core.EuclideanDistance();
Double distance = Dist.distance(clusterCentroid.instance(clusterNumber), Data.instance(instaceIndex));
注:此距离已归一化
https://stackoverflow.com/questions/17506149
复制相似问题