数据降维
分类
PCA(主成分分析降维)
相关系数降维
PCA 降维(不常用)
实现思路
对数据进行标准化
计算出数据的相关系数矩阵(是方阵, 维度是nxn, n是特征的数量)
计算出相关系数矩阵的特征值和特征向量...(虽然这里说的是向量, 但是是矩阵, 这个矩阵的每一列都是特征值或者特征向量, 是nxn), 特征值是每一个特征的特征值的集合, 但是在特征向量是每一个特征的特征向量的集合, 前者我们提到的特征值和特征向量是集合...0.9, 如果大于T, 则记录下来当前的位置k(k也就是我们选择的主成分的个数, 主成分就是特征, 也就是一列)
根据k选择主成分对应的特征向量
将标准化之后的数据(矩阵)右乘在上一步中选择出来的特征向量...(在这一步得到的矩阵就是m x new_n维度的了), 得到的就是主成分的分数, 也就是降维之后的数据集合
伪代码
X = load('data.xlsx', 'B1:I11');
m = size(X..., 1); % m 表示样本的数量
n = size(X, 2); % n 表示特征的数量
% 数据标准化
for i = 1:n
SX(:, i) = (X(:, i) - mean(X(:,