我写了一个KMeans类，但是结果看起来很奇怪，我哪里做错了？

python、numpy、k-means

我正在学习Joel Grus的“从头开始的数据科学”，并用它编写了我自己的KMeans代码(将Joel的函数替换为numpy函数，等等)。下面的代码收敛并找到质心，但它们几乎总是在特征空间的中心。在进一步的研究中，看起来while循环在第二次迭代时退出(即没有检测到任何变化)。我不知道为什么，我做错了什么？n_samples=200, cluster_std=2.75, random

浏览 47提问于2021-05-10得票数 0

1回答

多维数据k均值聚类后的主成分分析

python、data-science、cluster-analysis、k-means、pca

我有以下10个变量的数据集：我想用这个多维数据集来识别集群，所以我尝试使用以下代码来实现k均值聚类算法：data['clusters'] = clustering_kmeans.fit_predict(data) 为了绘制结果，我使用PCA

浏览 9提问于2021-10-24得票数 1

回答已采纳

1回答

阿帕奇马赫特数学VectorWritable失踪0.6？

csv、hadoop、mahout、k-means

我正在通过使用Mahout来进行kmeans聚类。但是，看起来Mahout的kmeans不支持CSV文件，然后我尝试编写一个特定的序列文件生成器。奇怪的是，我试图使用org.apache.mahout.math.VectorWritable类，但是这个类似乎不在mahout-math-0.6.jar包中。那么，有没有人知道VectorWritable类在哪

浏览 2提问于2012-02-24得票数 1

1回答

同义词似乎不适用于通配符请求。

elasticsearch

我无法让同义词在我的ElasticSearch上工作，我已经尝试过多个东西，但是没有什么效果，所以下面是我的设置：hello => world 其次，我的索引元数据ipSynonym的配置文件夹中创建了一个名为“同义词”的过滤器，该过滤器与synonym_path一起创建了一个新创建的synonym.txt文件。您可以看到，我在ipStrictAnalyzer和ipA

浏览 4提问于2015-03-05得票数 0

回答已采纳

1回答

基于虹膜数据集的Python模糊聚类

python、dataset、cluster-analysis、visualization、fuzzy-c-means

我正在对虹膜数据集进行模糊c均值聚类，但是由于一些错误而无法可视化。我为虹膜写了以下内容，但是它显示了名为"AttributeError: shape“的错误。这是我的代码：from sklearn.cluster import KMeansimport numpy=fuzz.cluster.cmeans(iris,3,2,error=0.0

浏览 9提问于2017-03-10得票数 3

1回答

路径和子路径对圆弧曲线的管理方式不同

svg、raphael

我在用拉斐尔生成圆弧曲线时遇到了问题。如您所见，绘制的第一条路径与第二条路径不同，第二条路径只是第一条路径的子路径。你知道为什么两者是不同的吗？我该如何解决这个问题呢？

浏览 0提问于2013-05-02得票数 1

回答已采纳

1回答

在R中，什么是最有效的kmeans集群包？

很抱歉，这看起来很模糊，但我有一个数据集，其中包含100多列和大约10^6行，这些列具有我想要聚类的特征。使用 nstart = 20,在i7-6700K上需要一个多小时它不使用多核，所以这是可以做的事情吗？谢谢!

浏览 0提问于2017-11-11得票数 6

2回答

如何设置K-means算法的种子值？

python、machine-learning、scikit-learn、cluster-analysis、k-means

我正在尝试根据特定的给定数据集对客户进行分组，这些数据集具有诸如道布、性别、州、PIN码、transaction_id、促销码等属性。每次我运行该算法时，聚类的轮廓得分与前一次相比有很大的不同，即结果不一致。这可能是因为数据集的随机种子。下面是将属性传递给算法的代码行。km1 = KMeans(n_clusters=6, n_init=25, max_iter = 600) 有没有什么方法可以分配集群或优化，使我每次运行程序后，得分都是一致的和更好的？我正在使用Pyth

浏览 3提问于2017-11-10得票数 0

回答已采纳

1回答

基于坐标和非空间要素的地理空间数据聚类

python、scikit-learn、cluster-analysis、geospatial、dbscan

假设我将以下数据帧存储为一个名为called的变量，其中前几行如下所示： business_lat business_lng business_rating 0 19.111841 72.910729如您所见，此数据是地理空间数据(具有lat和lng)，且每行都有一个附加值business _ rating，它对应于该行中较晚的业务的评级。我希望对数据进行集群，将附近具有相似评级的企业分配到同一集群中。从本质上讲，我需要一个地理空间集群，该集群有一个额外

浏览 74提问于2021-02-28得票数 4

回答已采纳

4回答

iphone中的委派

iphone、objective-c、ios、ipad、protocols

我使用的是从github下载的自定义Kal日历视图库。我很清楚如何创建委托协议，并成功地执行它们。但现在在我的应用程序中，当用户单击date时，我必须这样做，该日期直接反映到我的UIViewController类中。对于这种情况，我使用了@protocol委托方法，但我在其中遇到了奇怪的问题。请看下面的截图，并建议我哪里错了，然后我综合我</em

浏览 2提问于2012-01-17得票数 1

回答已采纳

4回答

为什么更改集群数会改变Kmeans中的情节？

r、clustering、k-means、plotting

我对kmeans还没有完全的数学理解，所以如果是的话，我很抱歉。set.seed(1)plotcluster(data, k$cluster) 我改变了x来看看情节是什么样子的下面是x=3和x= 4的结果

浏览 0提问于2019-06-24得票数 1

2回答

Mahout聚类:如何检索命名向量的名称

cluster-analysis、mahout

我想使用Mahout对多个文档进行聚类。集群工作得很好，但我不知道如何找到每个集群中的哪些文档。我看到在创建稀疏文件时可以使用--namedVector选项，但是它从哪里获取ID，在集群完成后如何检索这个ID？我有一个目录，每个文档都有一个文件。这些文件采用以下格式，文件ID为文件名：我用nam

浏览 2提问于2015-06-14得票数 0

回答已采纳

1回答

python、scikit-learn、cluster-analysis、pca

我将我的聚类中心投影到两个主成分上，但给出的图不在我的两组数据点的正确中心位置。我的代码如下所示。有没有人看到我哪里错了？PCA很好，但是集群的一个数据点还差得很远。我要提到的是，我的质心数据点有一半是负的。我已经尝试过反pca变换，真的不确定错误是从哪里来的。任何帮助都是非常感谢的！import numpy as npfrom sklearn.cl

浏览 0提问于2015-04-07得票数 0

1回答

我如何作为守护进程运行咕噜？

node.js、gruntjs、command-line-interface、daemon、epub

我正在运行一个打包的nodejs for服务器，它允许读取epub文件()，它是通过grunt命令启动的。但是，如果我在我的VPS上运行这个，那么当我的终端连接结束时，服务器就会死掉。我已经看过一些选项，比如grunt- piece和grunt-daemon，但是Gruntfile使用load-grunt-config编写的方式扰乱了我的思维，我无法拼凑出如何隔离服务器代码。

浏览 7提问于2015-05-02得票数 3

回答已采纳

1回答

K-意思是使用从minhash生成的签名矩阵。

python、text、cluster-analysis、k-means、minhash

我在文档和它们的标签上使用min散列来从这些文档生成签名矩阵。我已经证实，签名矩阵很好地比较了已知的类似文档的jaccard距离(例如，两篇关于同一运动队的文章或两篇关于同一世界事件的文章)给出了正确的读数。我的问题是:使用这个签名矩阵来执行k均值聚类有意义吗？我尝试过使用文档的签名向量，并在迭代的kmeans算法中计算这些向量的欧几里德距离，而我的集群总是没有意义。我知道应该有两个集群(我的数据集是几千篇关于体育或商业的文章)，最后，我</

浏览 0提问于2017-10-21得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

多维数据k均值聚类后的主成分分析

阿帕奇马赫特数学VectorWritable失踪0.6？

同义词似乎不适用于通配符请求。

基于虹膜数据集的Python模糊聚类

路径和子路径对圆弧曲线的管理方式不同

在R中，什么是最有效的kmeans集群包？

如何设置K-means算法的种子值？

基于坐标和非空间要素的地理空间数据聚类

iphone中的委派

为什么更改集群数会改变Kmeans中的情节？

Mahout聚类:如何检索命名向量的名称

Matplotlib pcolormesh网格与datetime对象不兼容

Twitter Bootstrap在Modal中的丑陋形式

如何在现有集群(Python)中检查一个新的点

c中双打的printf(%f)或printf(%lf)？

JAVA游戏在yCoordinate上的过关/中奖

为什么使用Sklearn将错误的聚类投影到PCA上？

我如何作为守护进程运行咕噜？

K-意思是使用从minhash生成的签名矩阵。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐