您不能使用k-means的inertia_属性，因为在执行时聚类算法还不适合

聚类算法是一种无监督学习方法，用于将数据集中的样本划分为不同的类别或簇。k-means是一种常用的聚类算法，它通过迭代的方式将样本划分为k个簇，使得簇内的样本相似度最大化，簇间的样本相似度最小化。

在k-means算法中，inertia_属性用于衡量聚类结果的质量。它表示所有样本到其所属簇中心的距离的总和，可以作为评估聚类效果的指标。较小的inertia_值表示样本在簇内的紧密程度较高。

然而，在执行聚类算法时，如果数据集不适合进行聚类，即数据集的特征不适合用k-means算法进行划分，那么使用inertia_属性来评估聚类效果是不合适的。可能会导致聚类结果不准确或无意义。

在这种情况下，可以考虑以下几个方面来改进聚类算法的适用性：

数据预处理：对数据进行预处理，包括特征选择、特征缩放、数据清洗等，以提高数据的可聚类性。
使用其他聚类算法：除了k-means算法，还有许多其他聚类算法可供选择，如层次聚类、DBSCAN、高斯混合模型等。根据数据的特点选择合适的聚类算法。
聚类算法参数调优：对于k-means算法，可以尝试不同的簇数k，并通过评估指标（如轮廓系数、Calinski-Harabasz指数）来选择最佳的簇数。
结合领域知识：根据具体的领域知识，对聚类结果进行解释和验证，以确保聚类结果的合理性。

总之，聚类算法的选择和应用需要综合考虑数据特征、算法适用性和领域知识等因素。在使用聚类算法时，需要根据具体情况进行调优和验证，以获得准确且有意义的聚类结果。

（以上答案仅供参考，具体推荐的腾讯云产品和产品介绍链接地址请根据实际情况进行选择）

页面内容是否对你有帮助？

有帮助

没帮助

您不能使用k-means的inertia_属性，因为在执行时聚类算法还不适合

、、、、

我想在gridSearchCV的得分函数中使用inertia_，它是K-means：https://scikit-learn.org/stable/modules/classes.html#module-sklearn.cluster中的属性。我尝试使用make_scorer :https://scikit-learn.org/stable/modules/generat

浏览 271提问于2019-05-15得票数 1

1回答

通过聚类进行客户细分

、、

我是datascience的新手，对于k-means (或任何)聚类算法，我有一个更具理论意义的问题。此时此刻，我正试图根据行为数据进行客户细分。我们设计了几个属性，如：-客户购买销售产品的百分比，-每次的平均产品数量-每个产品的平均价格-在商店购买产品的频率-以及其他几个属性。我们正在努力实现的是一组行为相似的客户，这样我们就可以根据他们<em

浏览 0提问于2017-02-13得票数 0

3回答

Matlab: Kmeans每次给出不同的结果

、、

我在matlab中对400x1000矩阵运行kmeans，由于某种原因，每当我运行该算法时，我都会得到不同的结果。, ~, ~, ~] = kmeans(factor_matrix, 10, 'dist','sqeuclidean','replicates',20);谢谢你的帮助！

浏览 2提问于2012-08-27得票数 8

1回答

DBSCAN中的参数估计

、、

我需要根据不同介词(如施事、工具、时间、地点等)的分布找到自然出现的名词类别。我尝试使用k-means聚类，但效果不佳，在我寻找的类上有很多重叠(可能是因为类的非球状形状和k-means中的随机初始化)。我现在正在使用DBSCAN，但我在理解这个聚类算法中的

浏览 1提问于2013-02-24得票数 9

回答已采纳

1回答

我对matlab计算机视觉系统工具箱中实现的函数包有一个问题。我正在研究不同类型图像的分类，首先我尝试使用bagoffeatures和diffenrets自定义提取器，我想将我的工作分成两个分支，首先提取SURFpoints并提取3种不同类型的描述符，例如SURFBRISK和FREAK，当我在自定义提取器中使用下一行时： features = extractFeatures(grayImage,multiscaleGridPoints,'Up

浏览 9提问于2017-02-27得票数 0

5回答

MATLAB kMeans并不总是收敛到全局最小值

、、、

我用MATLAB写了一个算法，我想我可以用它来测试用kmeans(X,k)构建的MATLAB。

浏览 0提问于2010-09-07得票数 7

回答已采纳

1回答

在具有新旧点的连续循环上的二维点识别/匹配

、

使用K-Means，我能够检测到dart集群。我是从玩家开始转轮的位置开始扫描的。这意味着第一个dart的扫描点最多，最后一个的扫描点最少。我用震动感应器探测到了飞镖。我在一个循环中运行K-Means，因此我计算的dart点随着时间的推移变得更加准确，因此每次运行时都会有更多的扫描点。现在，我想将我的集群中心分配给dart编号。我试着关注上一次运行的</

浏览 21提问于2021-01-17得票数 1

回答已采纳

2回答

如何在集群上应用集群？

、、、

我使用R library(igraph)对我的数据集进行聚类。我有几个连接的组件，但第一个非常大，这是巨大的组件。我想在这个巨大的组件上重新应用集群，以便重新构建集群。这样做有意义吗？

浏览 4提问于2019-06-06得票数 0

4回答

平均能量测量的聚类算法

我有一个数据集，它由具有如下属性的数据点组成：我对聚类技术很陌生。那么，我的问题是，哪种聚类算法最适合于这样的数据形成集群？

浏览 2提问于2015-05-30得票数 1

1回答

opencv中的K-均值聚类

、

好的，所以我必须说OpenCV提供的示例K-means算法程序非常令人困惑。即使花了一下午的时间，我也没能完全了解情况。以下是我想问的几个问题： 1)如何将给定的图像转换为单列矩阵，因为K-means函数只接受这样的矩阵作为输入？我知道我必须使用CvMat函数，但我不知道具体怎么用。2)使用一些预先确定的强度作为种子值，是否可以根据颜色强度进行聚

浏览 1提问于2012-06-15得票数 2

5回答

使用k-means进行文档聚类，聚类应该基于余弦相似度还是基于术语向量？

、、、、

我想使用k-means对结果进行聚类，然后应用一些内部和外部评估标准，看看我的新术语加权方法是否有任何优点。将TF-IDF归一化为固定长度的向量第7步:向量空间模型-余弦相似度我正在努力理解k-means的输入向量是否应该包含集合中每个文档相对于其他文档的

浏览 4提问于2015-05-11得票数 5

1回答

按圆心和半径对圆的数据进行聚类

、、、、

我有一个圆的数据集，圆心(x，y)和半径(R)。需要对位置接近的圆进行聚类。然后我有一个点需要找到最近的集群。我认为这部分应该通过聚类算法来开发，但不知道是哪种算法。对于下一步-找到最近的聚类，考虑到时间复杂性，找到它的最佳方法是什么？

浏览 0提问于2021-01-08得票数 0

3回答

您将使用什么算法来基于人员属性进行聚类？

、、

我是机器学习领域的新手(即使我觉得它非常有趣)，我想开始一个小项目，在那里我可以应用一些东西。你会怎么做呢？有什么想法可以让我开始吗？我在考虑使用PCA，因为我们可以有任意数量的维度，这可能有助于

浏览 2提问于2012-04-14得票数 1

回答已采纳

3回答

确定具有大数据集的k-means的最佳聚类数

、、

我有一个62列181408行的矩阵，我将使用k-means对其进行聚类。理想情况下，我想要的是一种确定最佳聚类数量的方法。我尝试过使用集群包中的clusGap实现gap统计技术(下面是可重现的代码)，但这产生了几条错误消息，涉及向量的大小(122 GB)和memory.limit问题，以及OS中的"Error in dist有没有人有什

浏览 3提问于2013-03-13得票数 2

1回答

在对机器人进行聚类后，开发了一个网络机器人爬虫系统

、、、

我试图在一段时间内识别高命中率的IP。换句话说，是否有任何统计方法来检查集群的质量。我能想到的是，如果我取一个

浏览 0提问于2016-03-16得票数 0

2回答

集群分析-寻找集群的中心

、

我已经创建了两个聚类算法: k-means和divisive，也许稍后我还会添加aglomerative。我必须分析它们在高维数据中的表现如何，为此，我必须计算到集群中心的平均/总和距离。在k-means的情况下，这很容易，我有质心，但是如何在除法/聚类法中找到中心呢？当我在这里的时候:我目前已经实现了Euclede距离，曼哈顿距离和皮尔逊距离

浏览 2提问于2013-04-04得票数 0

回答已采纳

1回答

查找“补码”位向量簇

、、

2: 0 1 1 0 1 0 我一直在检查不同的集群算法，但我确实找到了一个考虑到这种“互补”行为的算法，因为在这种情况下，BV的每一列都不涉及一个特征(仅表示在特定时间范围内向上或向下)。至于其他算法，如k-means或层次聚类，我不清楚是否可以在聚<

浏览 19提问于2017-08-30得票数 2

2回答

如何在邮件中找到集群

、、、、

我正在做一个机器学习项目，我有一个包含电子邮件中出现的单词频率的数据集。我需要找到每个邮件所属的集群。我所做的是将一个数据加载到pandas数据帧中，然后我训练了一个KMeans算法。然后我的python代码如下所示：import pandas as pd kmeans = KMeans(n_clusters

浏览 0提问于2018-09-15得票数 0

5回答

数据聚类算法

、、

什么是最流行的文本聚类算法，它处理大维度和海量数据集，并且速度快？在阅读了这么多的论文和这么多的approaches..now之后，我感到困惑，只想知道哪一个是最常用的，以便为编写文档集群应用程序提供一个良好的起点。

浏览 1提问于2010-12-02得票数 4

回答已采纳

1回答

力量(人)在地理上分布的想法或工具

、、、、

我正在寻找一种方法来放置现场人员，以便他们是尽可能接近主要数量的网站。我的想法是这样的:我有3000个lat&long网站。我想要选择我有多少人可以使用，通过这些信息，我想要获得最佳坐标来分布他们。我并不是在寻找现有的工具(但如果存在的话，我可以寻找它)，但我不知道如何开始这样的事情(我可以使用mysql，php，Gmap，如果它对我有帮助的话，我会学习另一种语言/工具)。谢谢

浏览 1提问于2013-03-01得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

您不能使用k-means的inertia_属性，因为在执行时聚类算法还不适合

相关·内容

您不能使用k-means的inertia_属性，因为在执行时聚类算法还不适合

通过聚类进行客户细分

Matlab: Kmeans每次给出不同的结果

DBSCAN中的参数估计

bagoffeatures提取不同类型的特征

MATLAB kMeans并不总是收敛到全局最小值

在具有新旧点的连续循环上的二维点识别/匹配

如何在集群上应用集群？

平均能量测量的聚类算法

opencv中的K-均值聚类

使用k-means进行文档聚类，聚类应该基于余弦相似度还是基于术语向量？

按圆心和半径对圆的数据进行聚类

您将使用什么算法来基于人员属性进行聚类？

确定具有大数据集的k-means的最佳聚类数

在对机器人进行聚类后，开发了一个网络机器人爬虫系统

集群分析-寻找集群的中心

查找“补码”位向量簇

如何在邮件中找到集群

数据聚类算法

力量(人)在地理上分布的想法或工具

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐