自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘
x2 = str_split(x," ")[[1]];x2 #是list 所以用[[]]
> plot(iris[,1],iris[,3],col = iris[,5]) # 横坐标是iris的第一列,纵坐标是第三列,以第五列的颜色分类 > text...
如果想知道读取后是什么数据结构,用class(变量名),不能输入文件名csv,不然是字符串,变量名一半不带“”,有“”的就是字符串
有时eSet里面有两个对象,可以到网页看一下,可能是因为测了两种芯片,我们分开分析就好。
eg:seq(from = 3, to = 2, by = 2) 可以写成seq(3,2,2)
文件名$列名 = c()赋值修改后的向量($提取的是一个全新的列名,之前不存在的)
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
列名中含有数值型数据,可以names_prefix/names_transform提取,可以用readr包中的parse_number()函数直接解析
dplyr是一个在R语言中非常流行的数据处理包,它提供了许多功能强大且易于使用的函数,包括 select、 filter、mutate、arrange和summ...
数据框函数- 排序arrange()和desc参数、distinct()去重复、mutate()数据框新增列
read.table(file="huahua.txt",sep ="\t",header=T)
左上角轴承图标 — script — 复制下来 — 保存到一个新的R中或者.txt文件
重启session(重新打开RStudio、重启R,打开新的session)时需要重新加载R包