我使用R library(igraph)
对我的数据集进行聚类。我有几个连接的组件,但第一个非常大,这是巨大的组件。我想在这个巨大的组件上重新应用集群,以便重新构建集群。这样做有意义吗?
发布于 2019-06-06 17:41:05
就其本质而言,除了人类决定赋予它的意义之外,集群没有任何意义。如果你想把集群分成更多的集群,那么你需要调整你正在使用的模型的超参数。
例如,K-means聚类允许您选择希望具有的先验聚类数量,而基于密度的聚类方法通常允许您定义一些重要的密度。您正在使用的库看起来并不是非常适合于集群,而是非常适合于图形计算。
我不太熟悉R,但您可能希望尝试一下clusterR包,因为它似乎有许多常见的聚类算法。我个人倾向于使用Python来处理这些事情,特别是一个名为scikit-learn的包。
希望这能有所帮助!
发布于 2019-06-06 17:41:34
我在评论中的意思是,我假设您有一个包含样本(行)和特征(列)的数据集。
例如,如果您对整个数据集进行K-means聚类,并获得您所说的结果,我将创建一个新的数据集,其中您只获取属于大聚类的样本。这样,您可以在这个新数据集上单独应用任何一种聚类技术,并且它应该拆分更多。
这是因为在您的原始数据集中,由于存在更大的相对差异,因此这个大集群中的差异并不重要(它们要小得多)。当你把大的差异放在一边,小的差异就可以恢复了。
https://stackoverflow.com/questions/56474270
复制相似问题