RCourse002R包安装与数据读写
绘制一张漂亮的图片需要什么?数据和绘图工具,在R环境中,数据的读写是什么样的?绘图工具又有那些?今天RCourse002给大家讲讲R包的安装与数据读写。
R包安装
R
Package,是R扩展工具,类似于游戏中的装备,装备不同的扩展工具会使得你的R可以很简单就完成一个相对复杂的分析或者可视化(例如,pheatmap绘图)
RCourse
Genut菌
上一节课说了R以及Rstudio的安装,经过后台反馈,有些看官使用的是Mac,打开了Rstudio显示不能连接到选择的镜像地址(warning: unable to access index for repository http://mirror...),如果您也遇到这种情况,请尝试开启Rstudio在的Mac中的连网许可。
01
Rstudio设置
点击Rstudio界面左上侧的【Tools】,选择【GlobalOptions】,选择【Package】,在弹框中选择镜像,国内的小朋友可以选择【China-*】,完成Rstudio的Package下载镜像的设置。
除了设置R package的下载镜像地址以外还可以设置Rstudio的其他内容,例如,【Appearance】。这些大家可以自由发挥 ~
02
连网R包安装
这里我们就以前面的pheatmap包安装为例子,在【Console】框中输入:,等待R包连网下载&安装,当R包安装完成会显示【Done】。
在这里如果没有选择适合的镜像地址可能会导致R包不能下载,或者有些看官使用的是Mac Rstudio,记得给Rstudio开连网权限,否则也会不能顺利下载R包。除了连网问题以外还会有些包会有一些特殊的依赖包或者前面提到有些R包是依赖于R版本等。具体问题欢迎后台勾搭Genut菌,报错格式【输入的代码行】以及【报错截图】。
03
R安装压缩包安装
点击左上角【Tools】-【Install Packages】出现上面的弹框,在【Install from】选择 【Package Archive File (.tar.gz),然后点击【Browse】选择已经下载好的R的安装压缩包地址,点击【Install】等待R包的安装,完成后会在Console显示【Done】。
除了可以通过工具栏对已下载好的R包安装以外,我们可以继续使用install.package()R包安装函数,不过需要设置函数中的参数:
install.packages("R包安装压缩包地址", repos = NULL, type = "source")
04
其他
请注意,请区分安装和载入R包,当安装完成后可以注释掉行,如果需要调用R报的时候用或载入R包。
除了上述的R包安装以外,还有配合github等的developer的安装方案,这些,后面的学习会遇到,到时候会另外详述,如果有看官刚好遇到这样的问题,请后台热烈的调戏Genut菌~
数据读写
R的数据来源有两种形式,第一种是通过外部数据读入;第二种是R/R包带有的【数据库】,使用R的时候我们需要把数据读入与写出,这个过程是怎么完成的呢?
RCourse
Genut菌
01
数据类型
R的常见数据类型有
character字符串(string),带有引号
numeric数值(num),可以进行四则运算
matrix矩阵,表格结构,表格元素只有一种类型
dataframe数据框,表格结构,表格元素可以是多种类型
02
数据读写
下面主要是讲简单的常见表格文件的读写以及R/R包【数据库】的数据读入,其他形式数据的读入请继续关注RCourse系列文章。
R/R包【数据库】数据读入
使用data()函数读入R/R包中的dataset数据,例如mtcars :
表格文件读入
首先是要准备需要读入的表格文件,如果您手上没有这样的文件,可以使用pheatmap热图绘制中的Example.xls文件:
链接:https://pan.baidu.com/s/1jRlm55nImIejiTPsn1o1AQ
密码:xvt7
查看变量类型,m是matrix(矩阵)类型,当row.names=NULL&header=F参数,m会变成dataframe(数据框)类型,因为,当row.names=1就是把第一列作为行名(charact)读入,header=T就是第一行作为header(charact)读入,剩下的表格元素均为numeric(数值);否则,表格的元素寄存在character,又存在numeric,表格以dataframe类型被读入。
对于刚刚开始学习R语言的老爷们经常会遇到的困惑,由于读进去的表格类型不一样所以导致有些函数运行报错(例如gplots::heatmap2())。如果还有老爷能顺利运行Example.xls的读入,但是,换成自己表格数据文件时,不能顺利读入,尝试把表格复制到Example.xls,覆盖原表格,另存为Example.xls(注意不要改变Example.xls的格式)。具体请继续关注RCourse系列文章,或者热烈地后台调戏Genut菌。
表格数据写出
表格数据写出在R中是由R/R包函数实现的,由于现实中数据存储文件的格式非常的多,所以,设计的R/R包函数也十分的多,今天讲的函数是最常用的表格数据写出函数write.table():
通过调整参数使得写出表格符合需要的形式(分隔符是\t,不需要行名,带有表头,不带有引号,数据为空(NA)的时候,以“-”来代替),上述最后一个输出是Genut菌最喜欢的设置 ~
文件的读写本来是比较多且复杂的,今天仅仅讲了其中最常用的表格文件的读写,看官们可能在实际操作的时候还会遇到各种各样的问题,欢迎热烈的后台调戏Genut菌 提出您们宝贵的意见以及建议 ~ 感谢各位看官关注Genut菌以及RCourse系列~
当然是Genut啦~ 你与Genut菌加在一起等于
“求知若渴”(Hungry)
让Genut菌陪着大家一起学习进步
请本栏目有兴趣的看官们,
长按下方二维码关注Genut的公众号。
领取专属 10元无门槛券
私享最新 技术干货