我有几个聚类算法调优有5个集群。如果新的数据不属于最初的5个集群,我想要第6个集群,在第6个集群中。
第6簇说其他类别由不属于5个聚类的所有数据点组成。
P.S.:-最初提供的任何数据都属于这5个集群。因此,假设数聚类为5的k均值算法。在推理过程中,我想添加第6簇,这样任何一个确实属于给定聚类的算法都可以根据阈值距离将其放入这个类别。我有文本数据。让我去哪种聚类算法,我应该使用dbscan,som等等。
发布于 2021-04-19 21:54:40
集群不像这样工作:例如,k-意味着将一个实例分配给最近的质心,而且由于始终有一个最近的质心,所以总是有一个实例“属于”的集群。
因此,如果您计划有“不在任何组中”的可能性,则需要一种不同的方法:
https://datascience.stackexchange.com/questions/93264
复制相似问题