首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将“其他”作为一组添加到聚类算法推理管道中

如何将“其他”作为一组添加到聚类算法推理管道中
EN

Data Science用户
提问于 2021-04-19 19:20:11
回答 1查看 28关注 0票数 0

我有几个聚类算法调优有5个集群。如果新的数据不属于最初的5个集群,我想要第6个集群,在第6个集群中。

第6簇说其他类别由不属于5个聚类的所有数据点组成。

P.S.:-最初提供的任何数据都属于这5个集群。因此,假设数聚类为5的k均值算法。在推理过程中,我想添加第6簇,这样任何一个确实属于给定聚类的算法都可以根据阈值距离将其放入这个类别。我有文本数据。让我去哪种聚类算法,我应该使用dbscan,som等等。

EN

回答 1

Data Science用户

发布于 2021-04-19 21:54:40

集群不像这样工作:例如,k-意味着将一个实例分配给最近的质心,而且由于始终有一个最近的质心,所以总是有一个实例“属于”的集群。

因此,如果您计划有“不在任何组中”的可能性,则需要一种不同的方法:

  • 在完整的实例集上重做集群
  • 应用第一步检测异常值
  • 为每个聚类训练一个一级分类模型。
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/93264

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档