功能与意义
统计分析工作中,常常需要研究分类变量间的联系,当所涉及的分类变量类别较多或者分类变量的个数较多的时候,我们就需要对应分析。对应分析的本质就是将行列变量的交叉表变换为一张散点图,从而将表格中包含的类别关联信息用个三点空间位置关系的形式表现出来。值得一提的是,这种方法没有涉及假设检验从而无法得知确切的统计结论。
相关数据
5387位小学生眼睛颜色于头发颜色的调查数据
分析过程
首先对数据进行预处理,以频数变量进行加权:
数据-加权个案
分析-降维-对应分析
结果分析
(1)对应分析
反映的是眼睛颜色和头发颜色不同组合下的实际样本数
(2)对应分析摘要
维度=最小分类数(眼睛颜色数)-1,前两个维度就解释了99.6%的信息。
(3)对应分析坐标值及贡献值
质量栏表示各种类别的构成比,维中的得分栏表示个类别在相关维度上的评分,惯量栏给出了总惯量在行变量中的分解情况,数值越大表示该类别对惯量的贡献越大。
深色、蓝色、浅色都主要分布在第一维度上,棕色主要分在第二维度上,总计表示各唯独的信息比例之和,可见红色这一类别在前两位中只提出80.3%的信息,效果最差。
(4)对应分析图
可以看出两个变量不同类别之间的关系。可以看出棕色头发和棕色眼睛,深色头发、黑色头发和深色眼睛,金色头发和蓝色眼睛、浅色眼睛存在着比较强的联系。