首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

因子分析及python实现(一)

因子分析(factor analysis)是用少数的不可观察的潜变量表示多数可观察的相关的变量的一种统计方法,是一种降维技术. 做因子分析的前提是自变量之间有相关关系. 这里的潜变量就是我们所求的因子,自变量是因子的表征.

因子分析又分探索性因子分析和验证性因子分析,探索性因子分析是先不假定一堆自变量背后到底有几个因子以及关系,而是通过各种方法试图寻找出具体几个因子及关系. 而验证性因子分析是假设一堆自变量背后有几个因子,试图验证这种假设是否正确.因子分析有两个核心问题,一是如何构造因子变量,二是如何对因子变量进行命名解释。

因子分析模型是把原观测变量分解成公共因子和特殊因子两部分.

其中X是原始变量标准化后的数据,F是公共因子,是特殊因子,A是因子载荷矩阵,不可逆,表示变量X在公共因子F上的载荷,即X与F的相关程度, A中元表示第i个变量在第j个因子上的负荷,也称为投影.

因子分析的一般步骤

将原始数据标准化处理 X

计算相关矩阵C

计算相关矩阵C的特征值 r 和特征向量 U

确定公共因子个数k

构造初始因子载荷矩阵,其中U为r的特征向量

建立因子模型

对初始因子载荷矩阵A进行旋转变换,旋转变换是使初始因子载荷矩阵结构简化,关系明确,使得因子变量更具有可解释性,如果初始因子不相关,可以用方差极大正交旋转,如果初始因子间相关,可以用斜交旋转,进过旋转后得到比较理想的新的因子载荷矩阵A'.

将因子表示成变量的线性组合,其中的系数可以通过最小二乘法得到.

计算因子得分.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181012A1T81J00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券