pca算法代码c语言_pca c语言算法_a 算法c语言代码 - 腾讯云开发者社区

numpy、linear-algebra、pca、matrix-factorization

给定维数X的维数D x N，利用QR分解计算C = np.dot(X, X.T)/N的特征值。依据如下：我们期望C的特征值是np.diag(r.T,r)，使用以下方法 q, r=np.linalg.qr(np.dot(X.T, V)) lambdas2=np.diag(np.dot(r.T, r)) / N 但是，我使用下面的代码在lambdas2中使用的值与lambda1中的值不同。 from sklearn.decomposition import PCA pca = PCA() pca.fit(X) lambdas1=pca.explained_variance_ 完整的例子

浏览 0提问于2019-03-12得票数 1

回答已采纳

1回答

通过优化加权向量使目标数最大化

r、optimization

我正试图通过1x42加权向量(权重)使数字N_ent最大化。 N_ent是使用以下函数计算的： N_ent <- exp(-sum((((solve(pca$rotation[])) %*% t(weight))^2)* (pca$sdev^2)/(sum((((solve(pca$rotation[])) %*% t(weight))^2)* (pca$sdev^2)))*log((((solve(pca$rotation[])) %*% t(weight))^2)* (pca$sdev^2)/(sum((((solve(pca$rotation[])) %*% t(wei

浏览 5提问于2015-12-28得票数 1

回答已采纳

1回答

PCL迭代最近点和其他报告空点云的效果

c++、point-cloud-library、point-clouds

我正在使用PCL与预构建版本(Windows的1.9.1)，甚至与源代码构建的PCL，但我无法使用迭代最近点(ICP)或甚至其他过滤器(例如，正常估计)来正常工作。下面是我的c++代码： #include <pcl/io/ply_io.h> #include <pcl/registration/icp.h> void test(void) { typedef pcl::PointXYZ PointType; typedef pcl::PointCloud<PointType> PointClo

浏览 4提问于2018-12-10得票数 0

1回答

如何用dask_ml运行主成分分析。我得到一个错误，“这个函数(tsqr)在高瘦矩阵的情况下支持QR分解”？

dask、dask-ml

我想对大约3000行6000列的数据进行降维。这里观察的数量(n_samples) <特征的数量(n_columns)。我不能使用dask-ml来达到这个效果，而同样的结果可以通过scikit学习来实现。我需要对现有代码进行哪些修改？ #### dask_ml from dask_ml.decomposition import PCA from dask_ml import preprocessing import dask.array as da import numpy as np train = np.random.rand(3000,6000) train = da.from

浏览 19提问于2019-02-16得票数 0

回答已采纳

1回答

主成分分析->反/反模式

fortran、pca、inverse

我已经在我的fortran代码中实现了一个开源的PCA代码，我只是将多维数据输入到一个2维矩阵( PCA_MATRIX(imagepixels_amount，image_count))中，然后输出PCA的第一个(最多)7个变换图像(它们被写入输入矩阵) 它在大多数情况下都工作得很好，但在某些情况下，我得到了一个我不理解的反向模式(在前3个组件中)，因为所有的输入图像都显示了类似的模式。我是不是遗漏了PCA的一个基本属性，它可能导致这种反转模式？我使用的库是：http://ftp.uni-bayreuth.de/math/statlib/multi/pca 我很感谢你的意见，我在网上找不到

浏览 16提问于2020-11-03得票数 0

回答已采纳

1回答

OpenCV 2.4.3PCA类-当样本数小于维数时

opencv、pca

我正在尝试使用OpenCv中的PCA类在我的C++应用程序中执行主成分分析操作。我是OpenCV的新手，我有一个问题，所以我希望有人能帮忙。我在Matlab和PCA类上都尝试了一个演示例子，当我使用2*10数据数组和参数(CV_PCA_DATA_AS_COL)时，检查答案，这里我有两个维度，所以我希望有两个特征向量，每个特征向量都有两个元素，这和预期的结果一样好，和Matlab的结果一样。但是，当使用10*2数据数组(通常当样本数小于维数)时，我得到了(2*10)个特征向量数组。即:10个特征向量，每个特征向量有2个元素。这是不期望的，也不是Matlab给出的结果(Matlab给出了10×

浏览 3提问于2013-03-07得票数 0

1回答

Adafruit的"adafruit_servokit“库返回伺服角设置误差

raspberry-pi、i2c、adafruit、servo

我想用给定的角度来控制伺服系统。我使用的是一个RaspberryPi 4型号B，这是运行拉斯宾。伺服系统连接到Adafruit PCA9685 16通道伺服驱动程序.伺服驱动器通过RaspberryPi与i2c连接。 Python版本3.7。我使用了以下教程：我能够正确地控制一个LED (就像在上述教程)与设置。 LED连接到通道8上的伺服驱动器，而伺服连接在通道2。这是我的代码(控制LED也包括在内)： import board import busio import adafruit_pca9685 from adafruit_servokit import ServoKit i

浏览 5提问于2021-10-19得票数 1

回答已采纳

1回答

为什么fit_transform在这个sklearn Pipeline示例中不起作用？

python、scikit-learn

我是一个新的sklearn Pipeline，并遵循了一个示例代码。我在其他例子中看到我们可以做pipeline.fit_transform(train_X)，所以我在pipeline.fit_transform(X)的管道上尝试了同样的事情，但它给了我一个错误 “返回self.fit(X，**fit_params).transform(X) TypeError: fit()恰好接受3个参数(给定2个)“ 如果我删除svm部分并将管道定义为pipeline = Pipeline([("features", combined_features)])，我仍然看到错误。有人知道为什

浏览 0提问于2016-06-28得票数 0

1回答

在matlab中，给出了哪些图像数据用于K均值聚类？

matlab、image-processing、k-means、pca

我的database.Iam中有100幅图像，同时使用这100幅图像作为训练集和测试图像，我需要用特征脸(PCA)来做5 clusters.Iam的特征extraction.What数据，在matlab中应该给出extraction.What命令。命令的语法： IDX，C= kmeans(X，k) 1.X值是多少？ 2.是否要给出欧几里德距离作为输入？ 3.是否要给输入图像的权向量？请详细解释一下。我试过的源代码 X = [] srcFiles = dir('C:\Users\rahul\Desktop\tomorow\*.jpg'); % the folder

浏览 7提问于2014-06-26得票数 0

回答已采纳

1回答

使用Scikit-Learn进行无监督学习网格搜索

scikit-learn

我收到以下代码的错误： import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_digits from sklearn.neighbors import KernelDensity from sklearn.decomposition import PCA from sklearn.grid_search import GridSearchCV from sklearn import linear_model, mixture, decomposition, datasets

浏览 11提问于2016-05-25得票数 0

1回答

PCA和UMAP之后进入随机森林。

pca、python-3.x

在将嵌入的聚类数据发送到随机森林分类器之前，先将PCA应用于数据集，然后将UMAP聚类应用于PCA数据，这是一个有效的过程吗？进程摘要： X_train -> x_PCA -> UMAP ->随机森林这是生成预测模型的有效过程吗？

浏览 0提问于2022-07-02得票数 2

回答已采纳

1回答

为什么在我执行PCA之后图像文件的大小会增加？

python、image、machine-learning、image-processing、pca

我正在为美国的鹿种建立一个图像分类模型，我目前正在对这些图像进行PCA，以减少它们的内存大小，并在达到这一点时减少模型的运行时间。我知道主成分分析应该在不放弃太多方差的情况下减少数据集的维数。所以当我注意到通过我的Deer_PCA函数运行的所有新的PCA压缩图像都比原始图像大的时候，我有点困惑。在n_components = 150上运行后，原始映像为128 KB，新压缩映像为293 KB。有人知道为什么会发生这种事吗？下面是我在函数中运行的图片，在运行代码之前将图像放在一个空文件夹中：下面是通过Deer_PCA函数运行它之后的新压缩映像：这是我的代码： #import s

浏览 2提问于2021-10-21得票数 0

回答已采纳

1回答

有滑雪差异的PCA

scikit-learn、pca

我试图在一个非常具体的上下文中应用PCA，并遇到了我无法解释的行为。作为一项测试，我正在使用您可以在这里检索的文件数据运行以下代码： (numpy数组格式)。 from sklearn.decomposition import PCA import numpy as np test = np.load('test.npy') pca = PCA() X_proj = pca.fit_transform(test) ### Project in the basis of eigenvectors proj = pca.inverse_trans

浏览 8提问于2020-10-19得票数 2

回答已采纳

1回答

绘制多维K-means聚类NLP python

python、nlp、k-means、scatter-plot、dimensionality-reduction

我有一个为NLP分类器设计的多维向量。下面是数据帧(text_df)：我使用TfidfVectorizer来创建向量： from sklearn.feature_extraction.text import TfidfVectorizer tfidf_v = TfidfVectorizer(max_df=0.5, max_features=13000, min_df=5, stop_words='english

浏览 14提问于2018-08-29得票数 0

2回答

新的预测标签总是在is之后随着PCA而变化。

python、k-means、pca

我正面临一个问题，那就是在PCA之后，我试图进行Kmean聚类，当我想对一个新的数据进行聚类时，预测标签总是在变化(即2到3到1.) #X is pre-defined dataset pca = PCA(n_components=2) reduced_data = pca.fit_transform(X) kmeans = KMeans(n_clusters=4) kmeans.fit_transform(reduced_data) for filename in os.listdir(directoryName):

浏览 5提问于2020-08-25得票数 0

回答已采纳

1回答

在Pyspark中执行PCA每次运行都会返回不同的结果

python、pyspark、data-science、databricks

有人能帮我理解为什么我的PCA每次运行都会得到不同的结果吗？我正在使用Databricks在Pyspark中工作我的代码的当前实现如下 from pyspark.ml.feature import PCA from pyspark.mllib.linalg import Vectors pca = PCA(k=35, inputCol="scaled_features", outputCol="pcaFeatures") model = pca.fit(df.select('scaled_features')) result = model

浏览 7提问于2021-10-27得票数 0

1回答

scikit学习PCA降维-大量特征和少量样本的数据

python、scikit-learn、pca

我正在尝试使用scikit-learn中的PCA进行降维。我的数据集大约有300个样本和4096个特征。我想将维度减少到400和40。但是，当我调用该算法时，得到的数据最多只有“样本数”的特征。 from sklearn.decomposition import PCA pca = PCA(n_components = 400) trainData = pca.fit_transform(trainData) testData = pca.transform(testData) 其中，trainData的初始形状是300x4096，结果数据形状是300x300。有没有办法对这种数据(大量的特

浏览 0提问于2014-03-21得票数 1

3回答

预测方法的意思是，它是如何工作的，它在做什么？

python、scikit-learn、k-means

我一直在玩sklearn的k均值聚类类，我对它的预测方法感到困惑。我在虹膜数据集上应用了如下模型： X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42) pca = PCA(n_components = 2).fit(X_train) X_train_pca = pca.transform(X_train) X_test_pca = pca.transform(X_test) kmeans_pca = KMeans(n_clusters=3).fit(X_tr

浏览 11提问于2022-07-04得票数 2

回答已采纳

1回答

PCA图约简维数

python、matplotlib、pca、dimensionality-reduction

我尝试使用PCA技术进行聚类。在我的例子中，我有n部电影的用户所做的评论。我以这种方式创建了一个表用户x电影： User Movie 0 1 2 3 4 0 2 0 5 0 0 1 0 1 1 0 0 2 0 5 5 5 0 其中0如果用户不看电影，1-5如果他评论从1到5星。形状为(6040,3706) 我将数据规范化，并在我使用此代码用于PCA之后(来自sklearn) pca = PCA(0.7) pca_result = pca.fit_transform(X_std) a = pca_result[:,0] b = pc

浏览 1提问于2019-02-27得票数 0

2回答

学习PCA:矩阵变换生成带有翻转符号的PC估计。

python、scikit-learn、pca

我正在使用scikit-学习在上执行PCA。科学工具包-学习文档由于实现中使用的奇异值分解(SVD)的实现精密度，在同一个矩阵上运行两次fit会导致主成分翻转(方向变化)。因此，始终使用相同的估值器对象以一致的方式转换数据是很重要的。问题是，我不认为我使用的是不同的估计对象，但我的一些个人电脑的迹象是翻转，当比较结果在SAS的PROC PRINCOMP程序。对于数据集中的第一个观察，SAS PC是： PC1 PC2 PC3 PC4 PC5 2.0508 1.9600 -0.1663 0.2965 -0.0121 从scik

浏览 1提问于2014-01-14得票数 7

2回答

SVD是非线性的，PCA是线性的吗？

machine-learning、unsupervised-learning

我很困惑，因为我的一位同事最近告诉我，他更喜欢使用SVD而不是PCA (通过eigendecomposition)，因为与后者相反，前者是非线性的，因此它也可以识别一些非线性模式。然而，我无法确切地看出SVD是如何非线性的，因为我的印象是它只是应用了一系列线性矩阵乘法(也请参阅这个StackExchange答案)。我知道this当然是非线性的，因此有时被称为非线性PCA。 SVD是非线性的，PCA是线性的吗？

浏览 0提问于2018-10-26得票数 4

回答已采纳

1回答

聚类降维所需的指导--一些数值的，大量的分类数据

python、scikit-learn、pandas、pca、dimensionality-reduction

我有一个Pandas中的数据，它有25.000行和1.500列，没有任何NaNs。在这些列中，大约有30列包含我用StandardScaler()标准化的数值数据。其余的是二进制值的cols，这些值来源于带有分类数据的cols。(为此使用了pd.get_dummies() ) 现在我想缩小尺寸。我已经在跑了 from sklearn.decomposition import PCA pca = PCA(n_components=2) pca.fit(df) 三个小时后，我问自己，我的方法是否正确。我还看到了PCA的两个变体，一个用于稀疏数据。这是否意味着在这样一个复杂的场景中运行PCA是没有

浏览 0提问于2018-11-15得票数 0

2回答

如何使用PAM数据在fviz_cluster中定义维度？

r、cluster-analysis、k-means、pca

我有一个数据框架，它被划分为行中的样本和列中的变量在执行PCA时： df.pca <- PCA(df, graph = FALSE, ncp = Inf) df.coord <- data.frame(df.pca$ind$coord) 然后在我的PCA数据上使用k-means： df.kmeans = kmeans(df.coord, 3, nstart = 25) 并可视化集群的形成： fviz.cluster(object = df.kmeans, data = df.pca) 我得到了一个具有正确维度的漂亮图表(我的数据的dim1为75%，dim

浏览 119提问于2019-04-23得票数 0

回答已采纳

1回答

实现一种将数据聚类和线性回归相结合的算法

python、clustering、linear-regression、pca

我有以下数据可用的在链接中作为一个csv，它传递有关恒星的信息。更具体地说，列ID表示示例的任意ID。列z表示我的目标变量(响应)。其他列表示每个示例可用的属性(预测器)及其相应的测量误差。我使用以下代码将11D数据缩减为3个主成分，并绘制了数据在主空间中的散度图(用颜色表示目标变量Z)。 from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler #first we remove the target z and ID from the dataset and standr

浏览 0提问于2020-02-23得票数 1

1回答

我需要帮助使用哪些特性来进行集群。

clustering、k-means、pca、dbscan

我正在使用这个数据集：https://www.kaggle.com/datasets/sobhanmoosavi/us-accidents 到目前为止，我已经成功地清理了数据集，并减少了功能和记录的大小。我有一些数字的特点，我已经标准化，还有一些分类的特点，我还没有触及。现在我需要使用Kmeans/Dbscan等来执行聚类，并比较它们的结果。我读到，由于有很多特性(38)，我可以对数值特征执行PCA，并使用PCA组件进行聚类。我还读到，在分类特征上使用PCA并不是非常正确，尽管它可能会产生结果。我想要进行聚类的方法是删除目标特性(“严重性”)，并对其余的特性进行无监督的学习，看看它对预测目

浏览 0提问于2022-06-18得票数 2

1回答

C++与PHP在PCA上的性能

php、c++、pca

我是否可以知道C++或PHP在运行PCA (主成分分析)方面是否更有效？我正在开发一个基于web的系统，用php上传图像，然后对图像进行处理，然后用PCA对图像进行分析，以确定图像是否与存储在数据库中的另一幅图像匹配。但是我想知道使用哪种语言(、C++或PHP或任何其他更好的替代)来实现更好的性能，以完成PCA任务。 tq~

浏览 1提问于2010-07-14得票数 0

回答已采纳

3回答

sklearn.decomposition.PCA explained_variance_ratio_属性不存在

python、scikit-learn、pca

当试图使用explained_variance_ratio_属性sklearn.decomposition.PCA识别dataset的前两列所解释的方差时，我会收到以下错误： AttributeError: 'PCA' object has no attribute 'explained_variance_ratio_' 我的代码(浓缩)： import pandas as pd from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA df =

浏览 0提问于2018-10-18得票数 1

1回答

如何解释由PCA的维度形成的聚类

cluster-computing、analysis、pca

如何解释PCA形成的集群可视化。假设我有13个变量A，B，C.....在我的数据集中，我想看看它们在无监督learning.As中的表现，你不能用所有的13个变量来可视化集群。在这种情况下，我将使用PCA进行降维，然后绘制聚类。我应该如何解释由PCA的2个维度形成的集群。

浏览 9提问于2018-02-07得票数 0

2回答

如何在python中进行PCA和SVM分类

python、classification、svm、pca

我正在进行分类，我有一个两种大小的列表，像这样； Data=[list1,list2] list1是1000*784大小。这意味着1000幅图像已经从28*28大小被重塑为784幅。 list2的尺寸是1000*1。它显示每个图像所属的标签。根据下面的代码，我应用了PCA： from matplotlib.mlab import PCA results = PCA(Data[0]) 输出如下： Out[40]: <matplotlib.mlab.PCA instance at 0x7f301d58c638> 现在，我想用SVM作为分类器。我应该加上标签。因此，我获得了SVm的如下新

浏览 7提问于2015-08-25得票数 1

回答已采纳

1回答

Python:数据分析的PCA问题

python、python-3.x、scikit-learn、ascii、pca

我正在尝试用PCA sklearn包做一些数据分析。我目前遇到的问题是我的代码分析数据的方式。下面是一些数据的示例波长强度；um 196.078431372549 1.108370393265022E-003 192.307692307692 1.163428008597600E-003 188.679245283019 1.223639983609668E-003 到目前为止编写的代码如下： scaler = StandardScaler(with_mean=True, with_std=True) #scales the data data_crescent=ascii.read(

浏览 16提问于2019-12-21得票数 1

回答已采纳

1回答

如何在Python代码中使用rpy2传递R函数作为参数

python、r、machine-learning、rpy2、nmf

我试图为出色的NMF包- (因为它比Python灵活得多)制作一个Python接口。到目前一切尚好。我想出了这样的点子： # Python rpy2 __NMF = importr("NMF") n_comp_R = robjects.IntVector(n_components) nmf_ro = self.__NMF.nmf(data, n_comp_R, methods, self.seed, nrun=10) 就像一种魅力。方法是我可以使用的可能的算法列表： nmfAlgorithm() 1“深色”"KL“"lee”"Frobenius“”

浏览 4提问于2017-01-26得票数 0

回答已采纳

1回答

主成分分析中n_components变量取值的确定

python、pca

祝您今天愉快。请帮帮我。我有一个规范化的文件。该文件由21个数字列组成。我将对此文件应用pca analysis，如下所示： pca = decomposition.PCA(n_components=21) pca_output = pca.fit_transform(pca_matrix) pca_inverse = pca.inverse_transform(pca_output) 据我所知，我分配给n_components变量的值等于列数。但我不明白的是，我如何确定n_components变量。

浏览 1提问于2018-05-01得票数 0

1回答

稀疏矩阵的内部处理

python、r、scikit-learn、sparse-matrix、pca

我一直在比较Python和R的几个PCA实现的性能，并注意到一个有趣的行为：虽然用Python计算稀疏矩阵的PCA似乎是不可能的(唯一的方法是 TruncatedSVD，但它不支持以均值为中心的计算方法，这就需要与PCA的协方差解等价)。他们的论点是，它会破坏矩阵的稀疏性。其他实现，如Facebook的PCA算法或scikit学习中的PCA/随机PCA方法，由于类似的原因不支持稀疏矩阵。虽然所有这些对我来说都有意义，但一些R包，如、rsvd等，能够处理稀疏矩阵(例如，使用rsparsematrix生成的矩阵)，甚至允许特定的center=True参数。我的问题是，R是如何在内部处理这个问

浏览 2提问于2018-06-14得票数 28

回答已采纳

1回答

如何对PCA和to后高度重叠的数据进行分类？

machine-learning、classification、class-imbalance、pca

我正在研究一个包含22个特征的不平衡天气数据的分类(3类)。即使应用PCA和the，数据也是重叠的。到目前为止，最优的分类分数是使用基于树的方法。为什么会有这样的PCA绘图，我能实现什么技术来获得超过80%的准确性？ 📷 📷

浏览 0提问于2021-10-26得票数 1

1回答

python中的滚动窗口PCA

python、time-complexity、pca、svd

我想知道是否有人知道如何实现滚动/移动窗口PCA，以便在添加和删除测量时重用计算出的PCA。我的想法是，我有很长一段时间的大量数据(测量)，我希望有一个移动窗口(例如，200天)从我的数据集的开始，每一步，我包括第二天的测量，并去掉最后一个测量，所以我的窗口总是200天长。但是，我不想每次都简单地重新计算PCA。有没有可能制定一种比简单地为每个窗口单独计算PCA更有效的算法？提前感谢！

浏览 62提问于2020-06-05得票数 2

回答已采纳

2回答

K-意味着质心标签在同一程序的运行中发生变化？

python、pandas、scikit-learn、k-means、pca

我观察到，相同程序的后续运行为k均值聚类提供了不同的标签，尽管原始特征是相同的。该程序将一组转换应用于原始数据帧，然后应用于新的数据帧，管道由以下顺序组成: StandardScaler -- > PCA --> K-means。在初始数据上确定的PCA和k-means模型用于下一个数据集。最后，程序进行逆变换，以便在初始特征空间中显示质心。所以我对不同的标签感到困惑，这里的相关函数是k-means .predict() import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklea

浏览 9提问于2020-05-19得票数 0

回答已采纳

1回答

基于主成分分析的SageMaker批量转换输出到K-均值数据类型误差

python、k-means、pca、amazon-sagemaker

我有来自PCA批处理转换作业"processed_features.csv.out“的输出文件，类似于JSON格式的S3中的{"projection":[0.248282819986343 -0.494019 -0.23275601863861]}。我也可以在这个位置's3://path1/path2/path3/model_artifacts/pca/transform/'中检索这个文件，但是，当我试图使用这个文件训练K-Means模型时，pca_transformer.output_path也可以检索这个位置。 job_name = "

浏览 10提问于2022-01-07得票数 0

1回答

为什么在用PCA进行简化后拟合随机森林模型时性能会受到影响？

python、scikit-learn、random-forest、pca、mnist

这个问题涉及到在一个完整的特征集上的随机森林分类器模型与在进行PCA后减少的组件数量上的随机森林模型之间的速度比较。我正在使用MNIST，它有6万行用于我的训练(X_train)和10,000行用于我的测试(X_test)，以及784个表示28x28图像的像素。对于完整的特性，我使用clock()来测量所需的时间，如下所示： clf = RandomForestClassifier() t0 = time.clock() clf.fit(X_train, y_train) runtime = time.clock() - t0 对于PCA和随机森林，我正在做类似的事情： pca = PCA(

浏览 2提问于2018-07-29得票数 1

回答已采纳

1回答

输出ELKI PCA结果作为文本

elki

我可以使用ELKI对我的输入数据集进行PCA并将转换集作为文本文件吗？文件的输出格式并不重要。我认为PCA不是作为一种算法，而是作为一个dbc.filter。我尝试在PCA过滤器之后调用NullAlgorithm，然后调用ResultWriter，但是它没有输出数据集(这并不奇怪，因为它结果返回null )。也许通过过滤器的结果的算法会是一种方便的功能？由于我对代码一点也不满意，也许有人可以告诉我我需要采取哪些步骤来实现这样的东西。

浏览 2提问于2016-06-02得票数 0

回答已采纳

1回答

为什么我的princomp绘图在没有返回错误的情况下仍然是空的？

r、plot、pca

Princomp已用于汇总大型数据集，摘要、屏幕图和加载都是有效的，并且所有代码都是从早期的pca中重复编写的。绘图的代码也非常相似，当它运行时，不会返回错误，但绘图是完全空的。这最初发生在原始代码中，但似乎通过再次运行princomp和summary解决了这个问题，这一次这个解决方案不起作用。 Plot_chars.abio.pca <-princomp(Plot_chars_standardised[,4:12]) summary(Plot_chars.abio.pca) Plot_chars.abio.pca$loadings screeplot(Plot_chars.a

浏览 21提问于2019-02-13得票数 0

1回答

数据分析PCA

categorical-data、pca、data-analysis

我有个关于PCA功能的问题。我有一个数据集，在9个属性中只有2个分类属性。在这两者之间计算pca好吗？这能帮我理解什么特别的东西吗？这是我的数据集谢谢

浏览 0提问于2020-05-08得票数 0

回答已采纳

2回答

主成分分析与SubSpace聚类有何不同?我们如何提取负责第一个PCA组件的变量？

clustering、visualization、pca

新更新：我理解PCA组件确保我们选择对高方差负责的变量，但我想知道如何通过PCA组件提取只对高方差负责的关键变量。理想情况下，一个简单的例子会有所帮助。这是我的密码： #Implementing PCA for visualizing after Kmeans clustering `# Interpret 3 cluster solution model3=KMeans(n_clusters=3) model3.fit(clus_train) clusassign=model3.predict(clus_train) # plot clusters “”新变量，称为规范变量，是根据方

浏览 0提问于2017-04-03得票数 -2

回答已采纳

1回答

进行PCA前后数据的维数

python、numpy、scikit-learn、pca

我正在尝试使用Python和scikit-学习。从培训数据中删除标签后，我将CSV中的每一行添加到如下列表中： for row in csv: train_data.append(np.array(np.int64(row))) 我对测试数据也是这样。我使用PCA对这些数据进行预处理，以便进行降维(以及特征提取？)： def preprocess(train_data, test_data, pca_components=100): # convert to matrix train_data = np.mat(train_data) # reduce b

浏览 3提问于2013-11-15得票数 6

1回答

如何创建一个R闪亮的应用程序来获取PCA图

ggplot2、plot、shiny、pca、scatter

我刚刚开始学习R闪亮，并试图创建一个闪亮的应用程序，为主成分分析生成散点图，并允许用户在X和Y轴的散点图上选择各种主组件。我知道如何编写R代码来进行PCA，但我似乎无法获得闪亮的应用程序来满足我的需求。我试过遵循Iris kmeans集群的示例，但我很难获得散点图。到目前为止，我的代码如下(P.S.我的原始数据集将基因作为行，样本作为列(第1至10列为癌症样本，11至20为正常)： data<-read.table("genes_data.txt", header=TRUE, row.names=1) pca_data<-prcomp(t(data), scale=

浏览 2提问于2019-12-01得票数 1

回答已采纳

1回答

如何确定PCA的质心

我有一个名为pca的主成分。我想要找到质心使用所有的组成部分(星系空间中心)，并找到每个样本的距离，从这个中心Sample。我怎样才能在R中做到这一点？ pca<-structure(list(Sample = c("1", "2", "4", "5", "6"), PCA.1 = c(0.00338, -0.020373, -0.019842, -0.019161, -0.019594), PCA.2 = c(0.00047, -0.010116, -0.011532, -0.011582, -0.01

浏览 3提问于2016-04-15得票数 2

回答已采纳

1回答

这一行在Excel VBA中是什么意思？

excel、vba

我真的不明白这行代码。 With Worksheets("SKU2PCA") .Range(Cells(SKU2PCA_New_RowNum + 1, SKU2PCA_StartBkt_ColNum), Cells(SKU2PCA_New_RowNum + PCACount, SKU2PCA_Last_ColNum)).FormulaR1C1 = _ "=VLOOKUP(RC1&RC2,BOM!C4:C5,2,FALSE)*SKU2PCA_Staging!R" & SKU2PCA_Last_RowNum + 1 &am

浏览 0提问于2018-01-26得票数 0

1回答

按类着色的一维情节巨蟒

python、matplotlib、seaborn、pca

我使用PCA并使用下面的代码对虹膜数据集进行了一维降维。我检查了的问题。 import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.decomposition import PCA import matplotlib.cm as cm # dataset iris = datasets.load_iris() X = iris.data Y = iris.target pca = PCA(n_components = 1, whiten = False) pca

浏览 6提问于2022-10-28得票数 0

2回答

不匹配pcacov

machine-learning、julia、pca

我试图应用PCA来降低维数和噪声，使用Julia语言，但是我得到了一个错误消息。你能帮我解决这个问题吗？朱莉娅还有别的选择来完成同样的任务吗？以下是错误消息： julia> X = (train_input)' |> Array; julia> typeof(X) Matrix{Real} (alias for Array{Real, 2}) julia> using MultivariateStats, MLJMultivariateStatsInterface julia> M = fit(PCA, X; maxoutdim = 3) Met

浏览 12提问于2022-11-18得票数 1

1回答

大型数据集上的PCA

python、matlab、pca、analysis

我有一个大的数据集，包括6个输入变量(温度，压力，流量等)，以提供一个输出，如产量，纯度和转换。总共有大约47600个实例，这些都在excel电子表格中。将人工神经网络和随机森林算法应用于该数据，得到了预测图和精度指标。(在Python中)随机森林模型具有一个赋予输入变量重要性的特性。现在，我想对这些数据执行PCA，首先将其与随机森林结果进行比较，并获得关于输入数据如何相互交互以给出输出的更多信息。我已经看了一些youtube视频和教程，让我的头脑围绕PCA，但他们使用的数据与我的完全不同。下面是我的数据片段。前6列是输入，最后3列是输出。如何使用PCA来分析这个问题？我在pytho

浏览 2提问于2020-04-26得票数 1

回答已采纳

1回答

使用PCA得分随着组件数量的增加而增加

python、scikit-learn、data-science、pca

我最近开始使用python从事机器学习等相关领域的工作。今天，我正在处理一个数据集，我想在其中应用降维并应用我的模型来评估分数。这个数据集有30个特征。我从一个简单的算法开始，这是Logistic回归，但在应用我的logistic回归之前，我想做一个PCA。为了确定哪个组件的数量是最好的，我使用了带有逻辑回归的gridsearchCV，只使用了C参数和我选择组件数量的主成分分析。我得到的结果是，我在PCA中使用的组件越多，精度得分就越高。以我的n_components=30为例，我得到了0.81的精度分数。问题是，我认为PCA用于降维(即处理较少的特征)，它可以帮助提高分数。有什么我不明白

浏览 1提问于2020-10-26得票数 0