主成分分析(Principal Component Analysis, PCA),是一种非监督机器学习算法,主要应用于数据的降维。另外,还可以应用于可视化、去噪等方面。
如下图所示,对于横纵轴的两个特征,关键是怎样找到到一个轴,使得样本空间的所有点映射到这个轴后,方差最大(各个点差别最大)。
主成分分析的步骤为:
在N维向量中也就是:
这其实就是一个目标函数的最优化问题,可以用梯度上升法求解。
以上是https://coding.imooc.com/learn/list/169.html [python3入门机器学习]课程做的笔记。