今天要跟大家分享的是相关系数图矩阵!
相关系数矩阵大家肯定都不陌生吧,作为识别变量之间的关系以及共线性程度,会在很多数据环境下用到。
但是相关系数矩阵毕竟全是数字,看起来还是不够直观,需要我们主动去识别,变量较多时真的能看花眼。
所以通常我们会输出变量间的相关系数图矩阵,这样可以很清晰直观的看出两两变量间的相关关系。
今天我会演示三种软件的 相关系数图矩阵的输出操作:
SPSS
Stata
R
基于SPSS24的相关系数图矩阵输出:
在SPSS24中打开你需要操作的数据:
在顶部菜单中点击图表——旧对话框——散点图
在弹出的对话框中选择矩阵散点图。
在弹出的散点图矩阵中选入你要计算的变量,确定。
以下是SPSS输出的散点图矩阵。看起来相对来说,要比相关系数矩阵的数字要直观很多。
基于Stata14的相关系数图矩阵输出:
在Stata14中打开操作数据:
cd F:\数据可视化\数据分析\计量经济学公众号——学习案例\model\
insheet using data.csv,clear
展示数据结构:
list in 1/10
输出散点图矩阵:
graph matrix gdppc hucap inv ls regovcon rfexp
这张散点图矩阵与用SPSS做出来的结果是一样的,只是风格上略有不同。
基于R语言的相关系数散点图矩阵:
首先使用命令打开要操作的数据:
data<-read.csv("F:\\数据可视化\\数据分析\\计量经济学公众号——学习案例\\model\\data.csv")
展示数据结构:
head(data)
由于INV1变量第一个值有缺失,可能会影响相关系数矩阵图,所以从新生成一个数据集,使用前六个变量(不包含INV1)。
生成作图数据:
data1<-data[,c(2,3,4,6,7,8)]
展示新数据结构:
head(data1)
输出散点图矩阵:
plot(data1)
使用R输出的散点图矩阵与前面使用的SPSS、Stata输出的散点图矩阵结构基本一致。
散点图矩阵在观察和探索多变量数据结构和关系时,可以给予我们非常直观的印象和直觉。与相关系数矩阵搭配使用,对于展示多维数据关系更有说服力。