首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于另一个变量或一组变量对变量进行聚类

基于另一个变量或一组变量对变量进行聚类
EN

Data Science用户
提问于 2020-03-19 15:08:52
回答 1查看 163关注 0票数 0
代码语言:javascript
运行
复制
df11[['COMPONENT_ID','FIRMWARE','SERIAL','CRP0_VDDN']].head()

考虑到我有这四栏要分析。我想用相似的字符组成3-5簇的COMPONENT_IDs .我希望基于剩余的特性或与COMPONENT_IDs相关的COMPONENT_IDs实现这一目标。我该怎么做?

EN

回答 1

Data Science用户

发布于 2020-03-19 16:42:03

首先,聚类只用于数值,特别是连续值。这里您要做的是集群一个分类变量,这也是一个ID列。我不确定目标,但这不是一个很好的技术聚类值。

尽管如此,我不确定ID列中有多少唯一条目。在聚类之前,您必须将其转换为分类数。然后只接受ID列和CRPO_VDNN列,并使用KNN对其进行聚类。您也可以在KNN中设置集群的数量。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/69946

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档