前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PCA基本原理

PCA基本原理

作者头像
Steve Wang
发布2023-10-12 09:34:23
1530
发布2023-10-12 09:34:23
举报
文章被收录于专栏:从流域到海域从流域到海域

PCA旨在找到数据中的主成分,并利用这些主成分表征原始数据,从而达到降维的目的。

PCA求解方法:

  1. 对样本数据进行中心化处理
  2. 求样本协方差矩阵
  3. 对协方差矩阵进行特征分解,将特征值从大到小排列
  4. 取特征值前
d

大对应的特征向量

\omega_1,\omega_2,...,\omega_d

,通过以下映射将

n

维样本映射到

d

x_i^{'}=\begin{bmatrix} \omega_1^Tx_1 \\ \omega_2^Tx_2 \\ ...\\ \omega_d^dx_d \end{bmatrix}

新的

x_i^{'}

的第

d

维就是

x_i

在第

d

个主成分

\omega

方向上的投影,通过选取最大的

d

个特征值对应的特征向量,我们将方差较小的特征(噪声)抛弃,使得每个

n

维向量

x_i

被映射为d维向量

x_i^{'}

,定义降维后的信息占比为:

\eta=\sqrt{\frac{\sum_{i=1}^d\lambda_i^2}{\sum_{i=1}^n\lambda_i^2}}

PCA推导过程可以使用空间上找一个投影方向

\omega

,使得所有样本点在该方向投影的方差尽可能大,对投影后方差的表示极为协方差矩阵,运用拉格朗日乘数法得出最佳投影方向就是最大特征值对应的特征向量。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2023-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档