我正在探索数据的结构,并按组件绘制解释的方差。因此,我用分量数等于维数来执行PCA。是否有一种方法可以使用较少的分量来执行逆变换?有点像
data = np.random.rand(100, 10) # data of size (N_objects, n_dim)
pca = sklearn.decomposition.PCA(n_dim)
transformed = pca.fit_transform(data)
# then I want to see restoration by different numbers of components
new_data_1 = pca.inve
我有一组数据,我使用了scikit learn PCA。在使用StandardScaler()执行主成分分析之前,我对数据进行了缩放。
variance_to_retain = 0.99
np_scaled = StandardScaler().fit_transform(df_data)
pca = PCA(n_components=variance_to_retain)
np_pca = pca.fit_transform(np_scaled)
# make dataframe of scaled data
# put column names on scaled data for us
安装SparsePCA后 from sklearn.decomposition import PCA
from sklearn.decomposition import TruncatedSVD
from scipy.sparse import random as sparse_random
from sklearn.decomposition import SparsePCA
from sklearn.random_projection import sparse_random_matrix
pca_a = SparsePCA(n_components=2, random_state=
我在Python中对音频谱图进行了PCA处理,并面临以下问题:我有一个矩阵,其中每一行都包含扁平的歌曲特性。在应用PCA之后,我很清楚,尺寸已经减少了。但我在常规数据集中找不到这些维度数据。
import sys
import glob
from scipy.io.wavfile import read
from scipy import signal
from scipy.fftpack import fft
import numpy as np
import matplotlib.pyplot as plt
import pylab
# Read file to get sampler
我有来自同一湖心的2个代理(特别是植物大型化石和遗体变形虫)的古数据。我已经对两个代理的转换数据运行了PCA。我希望在同一双图上被动地将一个代理绘制在另一个代理之上,以便调查其中一个代理可能如何影响另一个代理。
我很熟悉如何使用素食和绘图、点、箭头和文本命令等在R中构建一个双向图。我的问题是,如果我将一个代理绘制在另一个代理上,除了确保代理的缩放比例相同之外,是否还有其他方法来确保最终绘图的准确性?是否可以创建一个代理的双线图,并简单地覆盖第二组物种数据,如下所示?这就是所谓的“被动”覆盖吗?
# construct biplot for proxy1
plot(proxy1_pca, typ
如何在PCA之后从Python中的第一个分量重建图像?
我的尝试是:
from sklearn.datasets import load_sample_image
from sklearn.feature_extraction import image
from sklearn.decomposition import PCA
# Create patches of size 25 by 25 and create a matrix from all patches
patches = image.extract_patches_2d(grayscale_image, (25, 25), ra
我在一个大型数据集上进行了线性支持向量机,但是为了减少我执行PCA的维数,而不是对分量分数的子集进行支持向量机(前650个分量解释了99.5%的方差)。现在,我想用在PCA空间中生成的支持向量机的beta权值和偏差来绘制原始变量空间中的决策边界。但我不知道如何将支持向量机的偏差项投影到原始变量空间中。我用fisher虹膜数据编写了一个演示来说明:
clear; clc; close all
% load data
load fisheriris
inds = ~strcmp(species,'setosa');
X = meas(inds,3:4);
Y = species(
我使用对大量图像进行降维。一旦PCA被安装,我想看看组件是什么样子。
我们可以通过查看components_属性来做到这一点。没有意识到这是可用的,我做了另一件事:
each_component = np.eye(total_components)
component_im_array = pca.inverse_transform(each_component)
for i in range(num_components):
component_im = component_im_array[i, :].reshape(height, width)
# do something
我有以下数据可用的在链接中作为一个csv,它传递有关恒星的信息。
更具体地说,列ID表示示例的任意ID。列z表示我的目标变量(响应)。其他列表示每个示例可用的属性(预测器)及其相应的测量误差。
我使用以下代码将11D数据缩减为3个主成分,并绘制了数据在主空间中的散度图(用颜色表示目标变量Z)。
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
#first we remove the target z and ID from the dataset and standr