前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言之GEO基因表达数据的下载整合

R语言之GEO基因表达数据的下载整合

作者头像
一粒沙
发布2019-07-31 15:29:54
9.8K0
发布2019-07-31 15:29:54
举报
文章被收录于专栏:R语言交流中心R语言交流中心

启动bioconductor的“GEOquery”包。

代码如下:

source("https://bioconductor.org/biocLite.R")

biocLite("GEOquery")

GEOquery 的使用说明见下面链接:

http://www.bioconductor.org/packages/release/bioc/vignettes/GEOquery/inst/doc/GEOquery.html

载入包GEOquery: library (GEOquery)

获取数据包:

首先在自己的电脑新建文件夹作为存储数据的地方,然后执行下面的代码

Data<- getGEO("GSE2669",destdir="F:/geo/")

如下图:

代码解释:获取数据编码:GSE2669;数据下载存储地方:F:/geo/

然后获取矩阵数据:

myMatrix <- Data@GSE2669_series_matrix.txt.gz@assayData$exprs

获取样本数据:

myPDfile <- pData(phenoData(Data@GSE2669_series_matrix.txt.gz))

Meta(GSE2669):查看这个数据集的情况

GSMList(GSE2669):查看每个GSM具体

GPLList(GSE2669):查看GPL平台,常用来作为芯片注释

如果数据下载完成后出现错误:

那么可以用下面的代码载入已经下载好的数据:

Data <- getGEO(filename="F:/geo/GSE2669_series_matrix.txt.gz")

myMatrix <-Data@assayData$exprs

myPDfile <- pData(phenoData(Data))

以上获取里面的基因表达数据以及相关的样本数据过程有点漫长,如果觉得难以等待,可以直接用EXCEL打开,将里面的表达和样本数据直接复制出来另存为。

获取单纯的整合后的基因表达数据可以通过GDS:

gds <- getGEO("GDS507")

Meta(gds) :查看GDS的整体信息

Table(gds) 展示基因表达数据的矩阵

Meta(gds858)$platform 获取其平台信息

获取某个平台的信息:

gpl97 <- getGEO('GPL97')

查看详细的平台信息:

Meta(gpl97)

其实我们只需要一些重要的数据信息:

获取注释信息内容:

获取当前平台的所有样本ID:

获取当前平台的所有数据集信息:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-11-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档