全文链接:http://tecdat.cn/?p=6488
相关视频:复杂网络分析CNA简介与R语言对婚礼数据聚类(社区检测)和可视化|数据分享
复杂网络分析CNA简介与R语言对婚礼数据聚类(社区检测)和可视化
数据准备
计算相关矩阵
该函数的其他参数包括:
:字符串,指示要计算哪个相关系数(或协方差)。“pearson”(默认),“kendall”或“spearman”之一。
:将对角线设置为的值(通常为数字或NA)。
探索相关矩阵
过滤相关性高于0.8:
特定的列/行
此函数的作用与dplyr类似,但也会从行中排除选定的列。
选择相关的结果。所选列将从行中排除:
选定的列:
删除不需要的列:
按正则表达式选择列
选择高于0.8的相关性:
关注一个变量与所有其他变量的相关性:
重新排序相关矩阵
上/下三角
上/下三角形到缺失值
将数据拉伸为长格式
使用tidyverse和corrr包处理相关性
可视化相关系数的分布:
重新排列并过滤相关矩阵:
解释相关性
制作相关图:
重新排列然后绘制下三角形:
制作网络
关联数据库中的数据
使用SQLite数据库:
检测数据库后端,用于计算数据库中的相关性,并返回相关数据。
使用spark:
领取专属 10元无门槛券
私享最新 技术干货