首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R批量读取、处理及写出文件

R批量读取、处理及写出文件

作者头像
生信编程日常
发布2020-07-03 10:19:42
6.6K0
发布2020-07-03 10:19:42
举报

在对同一路径下多个文件做相同处理时,可以循环读取文件夹中的文件,批量读取,处理和写入文件,会大大提高工作效率,在R语言中,处理方法如下所示。

1.批量读取文件
path <- "~/path/to/your/file/"
fileNames <- dir(path) 
filePath <- sapply(fileNames, function(x){ 
  paste(path,x,sep='/')})   
data <- lapply(filePath, function(x){
  read.csv(x)})  
2.批量处理文件及写出

上面多个文件被读入到一个叫data的list的文件中,下面可以通过data[[]]来取出每一个文件来进行相同的处理。

for (i in 1:length(fileNames)){
  temp<-data[[i]]
write.csv(temp,paste0("../../AllMatrixCountGeneSymbol/",tag,".csv"))
  
}

下面是对ensembl id注释成gene symbol的例子 每个需要处理的文件为:

注释文件:

for (i in 1:length(fileNames)){
  temp<-data[[i]]
temp[,1]<-unlist(lapply(as.character(temp[,1]), function(x){strsplit(x, "\\.")[[1]][1]}))
tag<-unlist(lapply(as.character(colnames(temp)[1]), function(x){strsplit(x, "\\id_")[[1]][2]}))

colnames(temp)[1]<-"ENSEMBL"
temp<-aggregate(.~ENSEMBL,temp,mean)
temp<-merge(ann,temp)
temp<-temp[,-1]
temp<-aggregate(.~GeneSymbol,temp,mean)
rownames(temp)<-temp$GeneSymbol
temp<-temp[,-1]
write.csv(temp,paste0("../../AllMatrixCountGeneSymbol/",tag,".csv"))
  
}

参考: https://blog.csdn.net/u011596455/article/details/79601113

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.批量读取文件
  • 2.批量处理文件及写出
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档