首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >有哪些方法可以用来评估不同聚类算法之间的相似性?

有哪些方法可以用来评估不同聚类算法之间的相似性?
EN

Data Science用户
提问于 2020-06-12 22:54:02
回答 1查看 156关注 0票数 0

我正在进行广泛的客户细分分析,到目前为止实现了高斯混合模型、K均值和分层聚类。在大多数情况下,算法在簇的结构和数目(7-8)上达成一致。我想知道是否有一种共同的方法.

  • 比较簇间的相似性。你能将调整后的兰德指数应用于同一数据的两个不同的聚类(k-均值集群vs gmm)吗?我当时的印象是ARI是在你知道数据真相的情况下使用的。
  • 在集群中找到共同的集群。如果所有的算法都说一个集群是由高开销定义的,那么是否有一种方法可以确定最佳质心(S)用于一个“主”集群?聚类结果是常见的吗?
EN

回答 1

Data Science用户

发布于 2020-06-13 13:47:45

如果您只想看看两个算法之间的集群有多相似,那么使用sklearn.metrics.adjusted_rand_score()函数是一个很好的起点。这将适用于无监督的学习,不需要标签。

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.adjusted_兰德_score.html

还是你在考虑从整体上选择最好的组合组合?我认为“集群”结果不是一种常见的方法,但是网上有几篇文章讨论如何做到这一点。但我不知道有什么包裹能帮到你。一种想法是为每个算法创建一个新列,并选择分组,然后对这些列进行一些比较或计算,以获得最终的复合聚类。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/75923

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档