首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在集群上应用集群?

如何在集群上应用集群?
EN

Stack Overflow用户
提问于 2019-06-06 17:05:09
回答 2查看 135关注 0票数 0

我使用R library(igraph)对我的数据集进行聚类。我有几个连接的组件,但第一个非常大,这是巨大的组件。我想在这个巨大的组件上重新应用集群,以便重新构建集群。这样做有意义吗?

EN

回答 2

Stack Overflow用户

发布于 2019-06-06 17:41:05

就其本质而言,除了人类决定赋予它的意义之外,集群没有任何意义。如果你想把集群分成更多的集群,那么你需要调整你正在使用的模型的超参数。

例如,K-means聚类允许您选择希望具有的先验聚类数量,而基于密度的聚类方法通常允许您定义一些重要的密度。您正在使用的库看起来并不是非常适合于集群,而是非常适合于图形计算。

我不太熟悉R,但您可能希望尝试一下clusterR包,因为它似乎有许多常见的聚类算法。我个人倾向于使用Python来处理这些事情,特别是一个名为scikit-learn的包。

希望这能有所帮助!

票数 0
EN

Stack Overflow用户

发布于 2019-06-06 17:41:34

我在评论中的意思是,我假设您有一个包含样本(行)和特征(列)的数据集。

例如,如果您对整个数据集进行K-means聚类,并获得您所说的结果,我将创建一个新的数据集,其中您只获取属于大聚类的样本。这样,您可以在这个新数据集上单独应用任何一种聚类技术,并且它应该拆分更多。

这是因为在您的原始数据集中,由于存在更大的相对差异,因此这个大集群中的差异并不重要(它们要小得多)。当你把大的差异放在一边,小的差异就可以恢复了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56474270

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档