相关系数的计算大家都不陌生,那么如何让相关系数转变为可视化的结果成为大家比较头疼的事情,今天我们来介绍下R语言中相关系数的可视化实现方法。
R语言以R包为主,那么对于相关系数可视化同样有很多R包:
R包 | 描述 |
---|---|
ellipse | 以椭圆代表相关系数。 |
pcaPP | 用于两个相关系数矩阵的比较。 |
corrplot | 相关系数矩阵可视化专业户,推荐。 |
ggcorrplot | 相关矩阵重排序以及在相关图中展示显著性水平 |
corrgram | 比ggcorrplot 强一点。 |
在corrgram包中其实只有一个函数那就是corrgram()。 我们主要介绍corrgram包的使用,首先我们来看下包的安装,安装过程注意查看有一个“TSP”的包是否载入成功,它可能会影响这个包的使用:
X指的需要输入的数据矩阵,包括相关性矩阵或者需要处理的数据矩阵。
Type指的输入的数据是相关性矩阵(cor/corr)还是单纯的数据(data)。
Order指的基于PCA的排序,主要是利用的R包“seriation”中的seriate()函数实现各种方法排序。
Panel指的是每个格子内绘制图形样式,主要有以下几种:
参数
Diag.panel主要用来展示对角线的数据,其中包括某一变量的最大最小值(panel.minmax),密度曲线(panel.density),或者展示文本信息(panel.txt等价于text.panel参数)
Libel.pos指的对角线文本所在的位置,相对于对角线区域的左下角。
Col.regions指的颜色的过度区间
Cor.method指的是做相关性分析的方法,包括person,kendall, spearman
我们利用包自带的数据集进行图形绘制:
vars2 <-c("Assists","Atbat","Errors","Hits","Homer","logSal",
"Putouts","RBI","Runs","Walks","Years")
corrgram(baseball[vars2], order=TRUE, main="Baseball dataPC2/PC1 order",
lower.panel=panel.shade,upper.panel=panel.pie)
corrgram(baseball[vars2], order=TRUE, main="Baseball dataPC2/PC1 order",
lower.panel=panel.shade,upper.panel=panel.cor)