如何解释由PCA的维度形成的聚类

、、

如何解释PCA形成的集群可视化。假设我有13个变量A，B，C.....在我的数据集中，我想看看它们在无监督learning.As中的表现，你不能用所有的13个变量来可视化集群。在这种情况下，我将使用PCA进行降维，然后绘制聚类。我应该如何解释由PCA的2个维度形成的集群。

浏览 9提问于2018-02-07得票数 0

1回答

如何在Python中绘制多维的大型数据集？

、、、、

我尝试使用K均值方法绘制聚类，而数据集由60个维度的100万条记录组成。matplotlib花费了大量的时间来产生2D的结果，此外，我们如何将多维数据集绘制到2D？

浏览 3提问于2018-09-14得票数 0

2回答

PCA降维后的聚类

、、、

假设我们有一个大维的数据集，我们使用PCA将其降到了较低的维度，那么对所述数据使用聚类算法是否明智/准确？假设我们不知道会有多少个集群。在Iris数据集上使用PCA ( csv中的数据按顺序排列，以便列出所有的第一类，然后是第二个，然后是第三个)生成以下图：可以看出，Iris数据集中的三个类已被保留。然而，当样本的次序被随机化时，则会产生以下情节：- 上面，

浏览 5提问于2013-09-25得票数 0

回答已采纳

1回答

同时包含分类变量和数值变量的数据集的聚类算法的确定

、、、

我是机器学习的新手，正在尝试用聚类算法进行分割。然而，由于我的数据集既有类别变量(如性别、婚姻状况、首选社交媒体平台等)，也有数字变量(平均支出、年龄、收入等)，我无法决定哪些算法值得关注。我应该尝试哪一个:模糊c均值，k-medoids，还是与k- means ++进行比较的潜在类？对于这些类型的混合数据集，哪些会产生更好的结果？额外的问题:我应该尝试在没有降维的情况下进行聚类

浏览 0提问于2018-04-26得票数 0

1回答

我有一个维基百科的文章语料库。我确定了10,000个最常用的单词，找到了它们的Word2Vec向量，并在向量上使用球面k-means算法，根据词义的相似性将单词分成500组。我挑选了3个单词簇，并将这些单词转换回它们的词向量。每个单词向量都是一个由300个值组成的数组，所以我对所有值都应用了PCA (来自sklearn)，以将它们转换为2D。下面是我的PCA代码： for words in theList: #the

浏览 0提问于2017-09-18得票数 0

1回答

在R中对数据集应用pca后，减少数据集的维度

、、、

我的问题是如何使用R得到的主成分。pca1 <- prcomp(data_se

浏览 2提问于2013-09-16得票数 0

1回答

K-均值聚类对使用PCA和原始数据减少的数据有什么不同吗？

、、、、

我正在做聚类工作，我有90个特征，有13500个数据点，去除了相关变量，其中皮尔逊相关性超过90%，我的特征空间减少到70个。而且，几乎所有我最初的90个特性都有大量的零值(超过70%-80%的数据点)。我在算法实现方面所做的是：我所观察到的和我相应<

浏览 0提问于2020-01-21得票数 3

1回答

寻找原始特征对核主成分分析中输入主成分的影响

、、、、

我正在尝试将Kernel PCA实现到我的数据集，它同时具有分类(用一个热编码器编码)和数值特征，并将维度的数量从22个减少到3个维度。在此之后，我将继续讨论集群实现。我使用Spyder作为IDE。为了理解我从算法中产生的聚类的结构，我想解释哪些特征会影响派生的主成分，以及它们是如何影响它们的。有可能吗？如果是这样，我该如何解释

浏览 0提问于2018-05-31得票数 1

1回答

视觉分析中的主成分分析

、、、

我正在学习视觉分析，我有一个关于这个话题的理论问题。📷我不太清楚为什么对数据使用PCA来减少一些我们想要快速呈现的数据。广告示例，如果我有带有所有电影(S只是一个例子)的数据集和一些属性广告示例。这些数据之间的</e

浏览 0提问于2019-02-23得票数 0

1回答

多协变量稀疏矩阵的聚类

、

我有一个2M x 2000稀疏矩阵，其中行表示项，列表示维度。我想了解数据中是否有有意义的集群，我开始探索数据转换和规范化的维度。在一个项的2000年属性中，许多属性是协变的(rho > .5)。

浏览 0提问于2020-02-15得票数 0

回答已采纳

1回答

PCA后的聚类:使用标准化的数据，还是考虑到在每个PC上解释的差异？

、、

我对每天的网格数据进行聚类感兴趣。由于多个维度(网格点)，我首先执行PCA来降低维数，并保持n优先PCA至少占实际数据变化的85%。然后我用这些n个个人电脑作为k-均值聚类的输入。我的问题是，我应该使用标准化的(mean=0，std=1) PC作为k_Means集群的输入，还是根据每个PC所占的总变化百分比来调整PC。这种调整可以类似于PC我

浏览 0提问于2020-03-20得票数 1

1回答

高维稀疏数据矩阵的聚类

、、、

我目前有一个1000个条目的数据集，其中512个特性是稀疏的。我想把他们聚在一起。我可能错过了一些步骤或维数约简步骤，在这些步骤中，我很高兴回到过去，看看它会有什么不同，但是有人能推荐任何聚类算法或者指导我可以进一步研究的任何地方吗？我将看一看凝聚的分层聚类。

浏览 0提问于2022-09-05得票数 1

1回答

PCA图约简维数

、、、

我尝试使用PCA技术进行聚类。b = pca_result[:,1] 因此，对我来说，它的表现值是0.7，我的新形状是(6040,650当我看到这个维度是这样的(但我不认为是非常有意义的

浏览 1提问于2019-02-27得票数 0

5回答

数据聚类算法

、、

什么是最流行的文本聚类算法，它处理大维度和海量数据集，并且速度快？在阅读了这么多的论文和这么多的approaches..now之后，我感到困惑，只想知道哪一个是最常用的，以便为编写文档集群应用程序提供一个良好的起点。

浏览 1提问于2010-12-02得票数 4

回答已采纳

3回答

PCA分析后的特征/变量重要性

、、、、

我已经对我的原始数据集执行了PCA分析，并且从由PCA转换的压缩数据集中，我还选择了我想要保留的PC数量(它们几乎解释了94%的方差)。现在我正在努力识别原始特征，这些特征在简化的数据集中很重要。在降维后，我如何找出哪些特征是重要的，哪些特征不在剩余的主成分中？下面是我的代码： from sklearn.decomposition import PCA</

浏览 3提问于2018-06-11得票数 55

回答已采纳

1回答

PCA &聚类混淆

、、、

我有一个关于K均值聚类和PCA的问题。在我的项目中，我有两个目标类--0和1- -并且我试图将被预测为0的记录分组到5个集群中。我严格使用PCA作为可视化技术，因为我的数据框架有8个维度，我需要将其降到2-3维才能看到集群。我的问题是关于我应该遵循的程序~提取目标=0的所有记录第二条路：对所

浏览 0提问于2020-07-09得票数 1

1回答

如何应用PCA降低异构数据集的维数？

、、

我有一个包含定量和定性变量的保险索赔数据集，但是PCA拒绝转换或使用"string“类型变量。这是我使用的代码：claims=pd.read_csv('./insurance_claims.csv',sep=',',header=0)pca=PCA(n_components=12) pca</

浏览 0提问于2019-01-23得票数 1

1回答

主成分分析

、、、

我测定了42个不同基因型的不同植物性状和环境因素，如辐射或温度。我想知道哪些特质是相互关联的，哪些特质是相互影响的(例如辐射到特质)。于是我就想到了一位常设仲裁官。这是我的数据框架的一部分(release.year是指基因型的发布年份，每一行都是一个度量；每个基因型有多个度量)：46 1956 1857.880 21.68

浏览 8提问于2019-11-26得票数 0

回答已采纳

2回答

如何使用PAM数据在fviz_cluster中定义维度？

、、、

我有一个数据框架，它被划分为行中的样本和列中的变量 df.pca <- PCA(df, graph = FALSE, ncp = Inf)然后在我的PCA数据上使用k-means：并可视化集群的形成</e

浏览 119提问于2019-04-23得票数 0

回答已采纳

2回答

如何在Python中可视化多维集群？

、、、

我正尝试在Python语言中测试3种聚类算法(K-means，SpectralClustering，Mean Shift)。我有一个包含26列和数千行的数据集，我需要一些帮助来处理高维数据集(子集如下所示)。8 2 9 0 0 6 78 0 32 4 15 3 ... 0 2 4 0 2 1 2 1 0 0 我必须对具有非常高维度的数据进行聚类我想知道如何尽可能准确地实现它。<e

浏览 47提问于2021-02-12得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在Python中绘制多维的大型数据集？

PCA降维后的聚类

同时包含分类变量和数值变量的数据集的聚类算法的确定

用于词聚类的PCA和K-means

在R中对数据集应用pca后，减少数据集的维度

K-均值聚类对使用PCA和原始数据减少的数据有什么不同吗？

寻找原始特征对核主成分分析中输入主成分的影响

视觉分析中的主成分分析

多协变量稀疏矩阵的聚类

PCA后的聚类:使用标准化的数据，还是考虑到在每个PC上解释的差异？

高维稀疏数据矩阵的聚类

PCA图约简维数

数据聚类算法

PCA分析后的特征/变量重要性

PCA &聚类混淆

如何应用PCA降低异构数据集的维数？

主成分分析

如何使用PAM数据在fviz_cluster中定义维度？

如何在Python中可视化多维集群？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐