我的任务是对给定的二维5000个数据进行PCA和白化变换。
我对PCA的理解是用协方差矩阵的特征向量分析数据的主轴,并将主轴旋转到x轴!
这就是我所做的。
[BtEvector,BtEvalue]=eig(MYCov);% Eigen value and vector using built-in function
我首先计算了特征值和向量。结果是
BtEvalue=[4.027487815706757,0;0,8.903923357227459]
和
BtEvector=[0.033937679569230,-0.999423951036524;-0.999423951036524,-0.
我是蟒蛇的初学者,我希望你能帮我解决问题。
我有两个文件library.csv (9列)和cases.csv (8列),我用np.loadtxt读取它们。我从库中选择列将它们放入数组base[]中,除了最后一列之外,我将cases.csv放入数组problems[]中。我将用基[]数组的所有行计算问题数组中每一行之间的mahalanobis距离,并将最小距离存储在一个表中。
这是我的密码:
# Imports
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sn
我没有从Matlab函数中得到正确的结果,所以我的数据安排可能是错误的。我查看了我正在使用的函数的帮助文件,以及它所使用的输入"X“必须在表单中。
X的行对应于观察,列对应于变量。
很抱歉,如果这是非常基本的,但我的输入矩阵应该如何安排呢?
我有5个作者,每个作者都有一个长度为18的特征向量(例如,为了简单起见)。
因此,我假设observations是指同一作者的不同特性,而variables是指作者,所以我将输入矩阵安排为[18 x 5],其中每一列都是作者。
这个例子很简单。在SIFT特性的情况下呢?在这里,每个作者将产生一个特征矩阵[128 x num. of keyp
我有一个矩阵A,它的大小是2000*50000倍。我想要计算矩阵A的协方差矩阵,所以我使用下面的Matlab命令:
Y = cov(A)
但是出现了错误:
Out of memory. Type HELP MEMORY for your
options.
Error in test_2 (line 31)
Y = cov(A)
我的D磁盘仍然有250 GB。为什么会出现这个错误?如何解决这个问题?
我计算了两种证券收益的最小方差对冲比率(MVHR):
用样本计算最优h* = Cov(S,F) / Var(F)
运行OLS回归并获得beta值
这两个值略有不同,例如,我得到h* = 0.9547和beta = 0.9537。但他们应该是一样的。为什么是这样?
下面是我的代码:
import numpy as np
import statsmodels.api as sm
var = np.var(secRets, ddof = 1)
cov_denom = len(secRets) - 1
for i in range (0, len(secRets)):
cov
我有一个很大(500k X 500k)的稀疏矩阵。我想知道它的主要组成部分(实际上,即使只计算最大的PC也可以)。随机化的PCA效果很好,除了它本质上是寻找协方差矩阵的特征向量,而不是相关矩阵。使用大型稀疏矩阵的协方差矩阵找到PCA的软件包有什么想法吗?最好是在python中,尽管matlab和R也可以工作。
(作为参考,向提出了类似的问题,但方法涉及协方差矩阵)。
我有一个dataframe,df,它有一个名为id的列,其中每个值都是唯一的。
df
id name
A abc
B bcv
C dsf
D ere
E pmn
我将这组唯一的ids传递给一个函数。该函数返回两件事,一是dataframe,df_matrix,它还包含一个名为id的列。它返回的第二件事是一个covaraince矩阵(float64数组)。
df_matrix
id name
C dsf
A abc
E pmn
B bcv
df_matrix中的
我让python读取文本文件。
import numpy as np
with open("Input2010_5a.txt", "r") as file:
for line in file:
date, long, lat, depth, temp, sal = line.split("\t")
line_data = []
line_data.append(float(date))
line_data.append(float(long))
line_data.append(float(lat))
我是python的初学者,我正在使用python实现主成分分析(PCA),但我在计算平均值时遇到了问题。下面是我的代码:
import Image
import os
from PIL import Image
from numpy import *
import numpy as np
#import images
dirname = "C:\\Users\\Karim\\Downloads\\att_faces\\New folder"
X = [np.asarray(Image.open(os.path.join(dirname, fn))) for fn in os