前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文解决大批量基因相关性分析

一文解决大批量基因相关性分析

作者头像
用户1359560
发布2020-08-11 15:56:23
1.5K0
发布2020-08-11 15:56:23
举报
文章被收录于专栏:生信小驿站生信小驿站

目的是为了找出表达矩阵中有哪些基因与目的基因有相关性。

  • 下载数据
代码语言:javascript
复制
#=======================================================


#=======================================================

library(GEOquery)

rm(list=ls())

library(dplyr)

library(tidyr)

library(Biobase)

library(limma)


setwd('D:\\SCIwork\\F23\\GSE48780')


gsename = "GSE48780"

# 下载基因芯片数据,destdir参数指定下载到本地的地址
gse<- getGEO(gsename, destdir = ".") 
##根据GSE号来下载数据,下载_series_matrix.txt.gz


gpl<- getGEO('GPL570', destdir = ".") 
##根据GPL号下载的是芯片设计的信息, soft文件

gse  <- getGEO(filename = 'GSE48780_series_matrix.txt.gz')

gpl <- getGEO(filename = 'GPL570.soft')



# 查看列名
colnames(Table(gpl))

Table(gpl)[1:10,1:6] # 前10行前6列信息



gpl <- gpl@dataTable@table

colnames(gpl)



gpl <- gpl %>%
  
  dplyr::select(ID, "Gene Symbol")



write.csv(gpl,"GPL.csv", row.names = F)

# gse中的行名ID与gene name的对应关系
genename = read.csv("GPL.csv")


genename <- genename%>%
  tidyr::separate(Gene.Symbol,
                  into = c('Gene', 'Symbol'),
                  sep='\\///')%>%
  dplyr::select(ID,Gene )




##########################################################################################
## 
###########################################################################################



setwd('D:\\SCIwork\\F23\\GSE48780')


# 构建表达矩阵
exprSet <- as.data.frame(exprs(gse)) # 得到表达矩阵,行名为ID,需要转换


# 转换ID为gene name
exprSet$ID = rownames(exprSet)

express = merge( x=genename, y=exprSet, by="ID")

express$ID = NULL

express[which(is.na(express),arr.ind = T)]<-0 #结合which进行缺失替代



exprSet <- aggregate(x = express[,2:ncol(express)],
                     by = list(express$Gene),
                     FUN = max)
head(exprSet)


exprSet <- as.data.frame(exprSet)

exprSet <-exprSet[-1,]


names(exprSet)[1] <- 'ID'

rownames(exprSet) <- exprSet$ID

exprSet$ID <- NULL

write.csv(exprSet, file = 'exprSet.csv')

save(exprSet, file = 'exprSet.Rdata')
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档