前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多元统计分析:典型相关分析

多元统计分析:典型相关分析

作者头像
yiyun
发布2022-04-01 14:28:38
8970
发布2022-04-01 14:28:38
举报
文章被收录于专栏:yiyun 的专栏

简介

典型相关分析(Canonical Correlation Analysis, CCA) 探讨一组变量 与 另一组变量间的 相互关系 即是 典型相关分析,它是 简单相关 和 多元相关分析 的 延伸 ​ --- 《多元统计分析及R语言建模》(第五版)王斌会

目的:化简 复杂相关关系 利用 PCA思想 讨论 两组随机变量的相关性 将 两组变量间相关性研究 化为 少数几对变量间相关性研究, 且 此少数几对变量间 不相关

原理

典型相关分析 :研究两组变量间 相关关系 的一种多变量统计分析方法, 它 可以真正反映 两组变量间 相互依赖 的线性关系

两组变量: 第一组:

x1, x2, ... ,xp

第二组:

 y1, y2, ... ,yq

类似PCA的做法: 每组 变量 中 选择 若干代表性 综合指标(变量的线性组合),通过 研究 两组 综合指标 间关系 来反映 两组变量间 相关关系 即 线性组合 之间的相关关系 步骤:

  1. 每组变量 中 找 变量的线性组合,使其 具有最大相关性
  2. 每组变量 中 找 第二对线性组合,使其 分别与 第一对线性组合不相关, 而 第二对 本身具有次大相关性
  3. 如此反复,直到 两组变量间 相关性 被提取完毕

典型相关系数 的 求法

  1. 分别在每组变量中 找第一对线性组合,使其具有最大相关性
  1. 分别在每组变量中 找第二对线性组合,使其分别与本组内的第一对线性组合不相关,且拥有次大相关性

典型变量的性质

大多数情况下, 在进行 典型相关分析时, 可 先将 数据标准化样本协方差阵 = 样本相关系数阵, 此时 就不会 出现 特征根 不等于 相关系数的平方 的情况

典型相关系数的检验

典型相关系数的 显著性检验

求出 "去掉前 k 个典型相关系数的影响" 后 所剩(p - k) 个典型相关系数 是否 可达到显著

所 计算的

x2

值 若大于

x2[(p−r+1)(q−r+1)]

便 拒绝 典型相关系数为 0 的假设

步骤

案例

农村居民收入和支出典型相关分析

代码语言:javascript
复制
library(openxlsx)
Case11 = read.xlsx("../Res/mvcase5.xlsx", "Case11")

head(Case11)

image-20201212192309934

代码语言:javascript
复制
round(cor(Case11), 3)

image-20201212192528544

代码语言:javascript
复制
plot(Case11, gap = 0)

image-20201212192627826

代码语言:javascript
复制
# 最好先标准化
Z = scale(Case11)
head(Z)

image-20201212192712749

代码语言:javascript
复制
ca = cancor(Z[,1:4], Z[,5:9]);ca

image-20201212192952117

看列(1列1列看): [,1] 第一对典型相关变量 u1: X1 载荷最大 v1: Y1 载荷最大 X1 载荷,Y1载荷 相同正负 -> 相同方向的影响

结论:Y1(生活消费) 主要由 X1(工资性收入) 维持

$cor 相关系数 依次为 第1对典型相关变量(u1, v1) 的相关系数 第2对典型相关变量(u2, v2) 的相关系数 ...

同正负->同方向 的影响

代码语言:javascript
复制
source("../Res/msaR.r")
msa.cancor(Z[,1:4], Z[,5:9], plot = T)

image-20201212193057802

image-20201212193118730

image-20201212193140211

(系数),xcoef(x系数),​ycoef (y系数):载荷 第一对典型变量 u1,v1: 其中 X1(工资性收入)、X4(转移性收入) 有较大载荷(看绝对值大小),且X1载荷最大, 说明 u1 主要受 工资性收入及转移性收入 影响 其中 Y1(生活消费)的载荷最大,说明 v1 主要受Y1(生活消费支出)的影响, 从而可说明 Y1(农村居民生活消费 支出) 中,较大的部分是由 X1(工资性收入) 及 X4(转移性收入) 来维持的

Q&A

Q: 为什么需要 典型相关分析?或者说什么时候要用? A:TODO:

补充

方差

总体方差

image-20201210134135318

样本方差

image-20201210134105582

期望和方差

连续性

image-20201210134009927

求正态分布的数学期望&&方差

image-20201210134419462

参考

感谢帮助!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 原理
    • 典型相关系数 的 求法
      • 典型变量的性质
        • 典型相关系数的检验
        • 步骤
        • 案例
        • Q&A
        • 补充
          • 方差
            • 总体方差
            • 样本方差
          • 期望和方差
            • 连续性
        • 参考
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档