我正在进行广泛的客户细分分析,到目前为止实现了高斯混合模型、K均值和分层聚类。在大多数情况下,算法在簇的结构和数目(7-8)上达成一致。我想知道是否有一种共同的方法.
发布于 2020-06-13 13:47:45
如果您只想看看两个算法之间的集群有多相似,那么使用sklearn.metrics.adjusted_rand_score()函数是一个很好的起点。这将适用于无监督的学习,不需要标签。
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.adjusted_兰德_score.html
还是你在考虑从整体上选择最好的组合组合?我认为“集群”结果不是一种常见的方法,但是网上有几篇文章讨论如何做到这一点。但我不知道有什么包裹能帮到你。一种想法是为每个算法创建一个新列,并选择分组,然后对这些列进行一些比较或计算,以获得最终的复合聚类。
https://datascience.stackexchange.com/questions/75923
复制相似问题