多元统计分析：因子分析

yiyun

发布于 2022-04-01 13:55:43

2K0

发布于 2022-04-01 13:55:43

文章被收录于专栏：yiyun 的专栏

简介

（Factor Analysis, FA）

例 9.1

水泥行业上市公司经营业绩因子模型实证分析

利用 `factanal()` 基于`极大似然法`的因子分析

# factanal() 基于极大似然法的因子分析
# 该函数对数据分布要求极高，通常需假定数据来自多元正态分布
Fa1 = factanal(d9.1, 3, rotation = "none")
Fa1$loadings  # 因子载荷矩阵

基于 `主成分估计` 的因子分析函数 `msa.fa()`

# 自编因子分析函数 msa.fa()
source("../Res/msaR.R")

msa.fa(d9.1, m=6, rotation="none")$loadings

Fp1 = msa.fa(d9.1, m=3, rotation = "none")
Fp1$loadings

Fa1 # 极大似然法方差贡献

Fp1$vars  # 主因子法方差贡献

由主因子法结果，可看出，前三个因子的方差为 2.570, 1.713, 1.249，前3个因子所解释的方差占整个方差的 92.19%，基本能全面反映6项财务指标的信息，所以我们提取前3因子作为公因子

Fa1$uniquenesses  # 极大似然法 共同度

Fp1$common  # 主因子法 共同度

从上面结果，可看出，主因子法计算共同度比极大似然法好些

因子旋转

因子旋转方法： - 正交旋转（Orthogonal Rotation） - 斜交旋转（Oblique Rotation）

正交旋转法（varimax rotation）也称方差最大旋转法（spss中的varimax）。是使每个因子上具有最高载荷变量数最小，可简化对因子解释的旋转法。在主成分分析中，用到正交旋转法，假设各因素相关。假设提取出来的公共因素各不相关，是因素分析的最基本方法，与斜交旋转法相对应。
TODO: 这一段在百度百科上的解释与书上解释有冲突，书上解释看起来就像是说正交旋转法有很多种，而方差最大旋转只是其中一种。
在因子旋转过程中，若因子对应轴相互正交，则称为正交旋转
最常用的正交旋转方法是最大方差正交旋转法（Varimax）
若因子对应轴相互间不是正交的，则称为斜交旋转。常用的斜交旋转方法有 Promax 法等

极大似然法

Fa1 = factanal(d9.1, 3, rotation='none')
Fa1$loadings # 旋转前

Fa1$loadings[1:6,]  # 旋转前

Fa2 = factanal(d9.1, 3, rotation = 'varimax')
Fa2$loadings  # 旋转后

Fa2$loadings[1:6,]  # 旋转后

主因子法

Fp1 = msa.fa(d9.1, 3, rotation = 'none')
Fp1$vars  # 旋转前

Fp1$loadings # 旋转前

Fp2 = msa.fa(d9.1, 3, rotation='varimax')
Fp2$vars  # 旋转后

Fp2$loadings  # 旋转后

因子得分

在了解了各个综合因子具体含义后，可采用 回归法、Bartlett法等估计方法计算样本的因子得分下面是采用 主因子法 使用 回归估计法 计算的因子得分

Fp1$scores # 旋转前因子得分

Fp2$scores  # 旋转后因子得分

因子得分信息图

便于绘图，取前两个因子，x轴为 Factor1, y轴为 Factor2

plot(Fp2$scores, asp=1);abline(h=0, v=0, lty=3)
text(Fp2$scores, labels=rownames(d9.1))

biplot(Fp2$scores, Fp2$loadings)  # 因子得分信息重叠图
abline(h=0, v = 0, lty = 3)

9.5.3 综合得分及排名

Fp1$ranks

Fp2$ranks

可看出，两种方法结果有出入，这与采用的算法有关。因为做因子分析通常需要做因子旋转以获得较好的因子解释，所以我们认为旋转后结果做综合评价要好些。

9.6 因子分析的步骤

9.6.1 因子分析基本步骤

计算简单相关系数矩阵，若矩阵中大部分数值过小（<0.3），则认为大部分变量呈弱相关，不适合做因子分析若某变量和其他变量相关性较弱，则在接下来分析中可考虑剔除该变量

d3.1 = read.xlsx("../Res/mvstats5.xlsx", 'd3.1', rowNames = T)

cor(d3.1)

KMO 效验

KMO效验：用于比较变量间简单相关系数和偏相关系数的指标 KMO 取值 [0, 1] KMO值越接近 1，意味着变量间相关性越强，原有变量越适合做因子分析 KMO值越接近 0，意味着变量间相关性越弱，原有变量不适合做因子分析当所有变量间的简单相关系数平方和接近0时，KMO值接近0

msa.KMO(d3.1)

TODO：

Bartlett's 球体效验目的：检验相关矩阵是否是单位矩阵显然单位矩阵变量间不相关若是单位矩阵，则认为因子模型不合适
检验的虚无假设为相关矩阵是单位阵若不能拒绝该假设，则表明数据不适合因子分析
一般，显著水平值越小（<0.05），表明原始变量间越可能存在有意义的关系若显著性水平很大（>0.10），可能表明数据不适合因子分析
该统计量服从卡方分布

msa.bartlett(d3.1)

9.6.2 因子分析过程

2. 因子评价

未旋转 F0

F0 = msa.fa(d3.1, 3, rotation='none')  # 未旋转F0
F0

旋转后 Fr

Fr = msa.fa(d3.1, 3, rotation="varimax")  # 旋转 Fr
Fr

信息重叠图分析

biplot(Fr$scores[,1:2], Fr$loadings[,1:2])

biplot(Fr$scores[,c(1,3)], Fr$loadings[,c(1,3)])

biplot(Fr$scores[,2:3], Fr$loadings[,2:3])

从双重信息图可知，各个变量在广东、上海、北京、天津这些地区的反映强烈，说明这些地区在各个指标消费都较高，广东人在交通和通信上花的钱明显多于其他地区，而北京在居住上花的钱较多。

案例

上市公司经营业绩评价的因子分析

library(openxlsx)

Case9 = read.xlsx("../Res/mvcase5.xlsx", "Case9", rowNames=T)
head(Case9)

(FA0 = factanal(Case9, 4, rotation="none"))  # 因子不旋转

前4个因子的方差贡献率已占到累积方差贡献率的 84% ，所以只需前4个因子即可

pairs(FA0$loadings)

(FA1 = factanal(Case9, 4, rotation="varimax"))  # varimax法旋转 (varimax，即正交旋转：旋转前后，互不相关)

旋转后的因子载荷矩阵：Loadings: 可知，因子

在 每股收益

、每股净资产

、净资产收益率

、扣除后每股收益

上的载荷量较大，反映 上市公司给与其股东的回报，在此因子上得分越高，公司能够给与股东的回报 也越高因子

在存货周转率

、固定资产周转率

上有较大载荷量，所以是反映公司资产管理能力的综合指标因子

在总资产周转率

、主营业务利润率

上载荷量较大，主要体现了公司的短期偿债能力，是债权人非常关心的项目 ... 第四个因子

是反映公司盈利能力的公共因子

竖着看，一个公共因子一列的看，看哪些在此因子中占比大，这些大的用来判断分析这是什么样的因子

pairs(FA1$loadings)

source("../Res/msaR.r")

FA2 = msa.fa(Case9, 4);FA2

Q: Factor 列起着什么作用？为什么说从因子排名表可看到，在 偿债能力方面，片仔癀一枝独秀？看到排名1了，但并没有说明偿债能力啊 A: TODO: Factor 列起着什么作用？为什么说从因子排名表可看到，在 偿债能力方面，片仔癀一枝独秀？

pairs(FA2$scores)

biplot(FA2$scores, FA2$loadings)  # 前2个因子信息重叠图

Q&A

补充

参考

感谢帮助！

《多元统计分析与R语言建模》王斌会
本文作者： yiyun
本文链接： https://moeci.com/posts/分类-数据分析/分类-杂记/factor-analysis/
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2020-12-04，如有侵权请联系 cloudcommunity@tencent.com 删除

编程算法

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

编程算法

登录后参与评论

0 条评论

热度

多元统计分析：因子分析

多元统计分析：因子分析

简介

例 9.1

相关分析

利用 `factanal()` 基于`极大似然法`的因子分析

基于 `主成分估计` 的因子分析函数 `msa.fa()`

因子旋转

极大似然法

主因子法

因子得分

因子得分信息图

9.5.3 综合得分及排名

9.6 因子分析的步骤

9.6.1 因子分析基本步骤

KMO 效验

9.6.2 因子分析过程

2. 因子评价

未旋转 F0

旋转后 Fr

信息重叠图分析

案例

Q&A

补充

参考

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

多元统计分析：因子分析

多元统计分析：因子分析

简介

例 9.1

相关分析

利用 factanal() 基于极大似然法的因子分析

基于 主成分估计 的因子分析函数 msa.fa()

因子旋转

极大似然法

主因子法

因子得分

因子得分信息图

9.5.3 综合得分及排名

9.6 因子分析的步骤

9.6.1 因子分析 基本步骤

KMO 效验

9.6.2 因子分析过程

2. 因子评价

未旋转 F0

旋转后 Fr

信息重叠图分析

案例

Q&A

补充

参考

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

利用 `factanal()` 基于`极大似然法`的因子分析

基于 `主成分估计` 的因子分析函数 `msa.fa()`

9.6.1 因子分析基本步骤