用一个低维度的向量表示原来高维度的特征,避免维度灾难。
原始数据高维向量包含冗余与噪声。主成分分析(Principal Components Analysis,PCA)是最经典的降维方法,具有线性、非监督、全局等特点。 PCA需要定义主成分,设计提取主成分。 举个例子 如果在三维空间里面,一系列数据点过一个平面,如果我们使用xyz来表示,就需要用到三个维度。而如果我们将其放在一个平面,使用xy来表示,那么就只有两个维度,而且数据也不会有任何的丢失,这样,我们就完成了从降维,从三维到二维。 对于给定的一组数据
,其中所有向量均为列向量,中心化后表示为
,其中
。
,通过以下映射将n维样本映射到d维
相关阅读:
本文分享自 Python与MySQL 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!