文档目录
随机事件及其概率
随机变量及其分布
期望和方差
大数定律与中心极限定理
数理统计的基本概念
参数估计
假设检验
多维
回归分析和方差分析
降维
10.1 主成分分析(PCA)
不懂线性代数,...目标
PCA 常用于高维数据的降维,可用于提取数据的主要特征分量.
对于原始数据矩阵
其中, 列向量 为 n 个样本中的一个. r 行表示 r 个维度....则协方差矩阵与中心化后的原始数据矩阵存在以下关联:
设要投影的单位向量为 V , 则得到的投影后的值为V\cdot Z=V^TZ, 投影后的方差为:
其中 \alpha_i 为 Z...降维
将 ② 代入 ① 得 s^2 = F(V) = \lambda, 特征值 λ 越大, 则散度越大....根据最终需要的维度 d 来选择前 d 大的特征值对应的特征向量, 并将特征向量单位化后组成矩阵 W = (w_1,w_2,\cdots,w_d), 由于每个点都可以视为在各个特征向量方向上的投影组成, 则最终降维后