我使用K-均值算法来创建簇。如您所知,K-均值算法需要簇数作为参数。我尝试将集群数从8开始计算为2,然后在每个循环中计算集群的所有C-索引,然后得到这些C-索引的副手。然后比较C指数的平均值,选择最小的C指数平均值作为最优聚类数.这是检测集群计数的真正方法吗?
发布于 2014-12-09 08:48:38
没有一种正确的方法来检测群集计数。参见下面的谷歌搜索,这仍然是一个活跃的研究领域。维基百科的文章说:
对k的正确选择通常是模棱两可的,其解释取决于数据集中点的形状和规模以及用户期望的聚类分辨率。
只有您才能确定以这种方式使用c索引是否是确定域中群集号的好方法。请参见使用聚类中的C-索引的另一个问题。
https://stackoverflow.com/questions/27374165
相似问题