R的数据类型:向量与数据框

今天是生信星球陪你的第78天

你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。

你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。

终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆!

小抄常识早知道

(1)R的赋值符号不是等号,而是

(2)在Console 控制台输入命令,相当于Linux的命令行

(3)显示工作路径 getwd()

设置工作路径 setwd(/home/u1234/R)

(4)向量是由元素组成的,元素可以是数字或者字符串。

(5)表格在R语言中改名叫数据框^_^

(6)数据类型

向量(vector)

矩阵(Matrix)

数组(Array)

数据框(Data frame)

List

1.标量和向量

标量:一个元素组成的变量

定义字符串变量:a

向量:多个元素组成的变量

x

x

x

x

从向量中提取元素

(1)根据元素位置

x[4] 第4个元素

x[-4]排除法,除了第4个元素之外剩余的元素

x[2:4]第2到4个元素

x[-(2:4)]除了……

x[c(1,5)] 第1个和第5个元素

(2)根据值的大小

x[x==10]等于10的元素

x[x

x[x %in% c(1,2,5)]存在于向量c(1,2,5)中的元素

2.数据框

(1)读取

read.table(file = "a.txt",sep = "\t",header =T)

#读取文件,分隔符为table,有表头

a

数据框由行名和列名组成

查看列名colnames(a)

查看行名rownames(a)默认值为1.2.3.4行号

有的公司返回数据,左上角第一格为空,R会自动补为x

修改:colnames(a)[1]

修改第一列为行名:a

查看帮助:?read.table

(2)修改/导出

write.table(a,file = "a_out.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号)

(3)保存与重新加载

保存当前所有变量save.image(file="example.RData")

保存其中一个变量save(df1,file="df1.RData")

使用时 ,load (df1.RData)

(4)提取元素

a[x,y]第x行第y列

a[x,]第x行

a[,y]第y列(横着写)

a[y] 第y列(竖着写)

a[a:b]第a列到第b列

a[c(a,b)]第a列和第b列

(5)直接使用数据框中的变量

提取第b、c列作散点图:

plot (a$b列名,a$c列名)

--缺点:数据框名a在代码中重复出现

解决:

方法1:attach(只用一个数据框)

将数据框名添加到搜索环境中:attach(a),作图时就只需输入列名。

做完后将a删除出搜索环境 detach(a)

局限性:两个以上数据框列名有冲突,同时attach会报错。

方法2:with

with(a,{

plot(a$列名,b$列名)#用a、b列作图

x

})

x #运行完后打印x

初学生信,很荣幸带你迈出第一步。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180727G20TMZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券