首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >大数据的聚类度量

大数据的聚类度量
EN

Data Science用户
提问于 2019-05-16 05:57:10
回答 1查看 56关注 0票数 0

我有一个包含150 k行和10列的数据集。在集群之后,我想获得集群度量。下面是我想要use>的指标列表

代码语言:javascript
复制
 "C_index", "Calinski_Harabasz", "Davies_Bouldin", "S_Dbw", "Silhouette"

我有个问题。我尝试过使用clusterCrit (来自R)和sklearn (从python)获取值,但是当我尝试使用clusterCrit获取每个值时,花费了大量的时间,所以我无法得到它。

我认为这是因为大数据(我的RAM是8GB)。我有办法得到这些价值吗?

EN

回答 1

Data Science用户

发布于 2019-05-18 20:04:29

只需使用数据的子样本即可。

在评估(或聚类,通常)整个数据集方面几乎没有用处。这是高度多余的。试图将其扩展到整个数据集是浪费时间。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/52045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档