手把手教你用R语言下载TCGA数据库:RTCGA

RTCGA这个包工作流程如下:

该包实际上一系列根据数据类型分离的包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA的所有数据。具体网址:

https://rtcga.github.io/RTCGA/index.html

下面开启你的R界面,学习该包:

1. 首先安装,因为我们是需要下载RNAseq数据,所以我们还需要安装RTCGA.mRNA包,同样借助BiocManager安装,前提也是你要安装好BiocManager,命令如下:

2. 加载该包:

OK,可以看到没有任何问题,这也表明,我们安装并成功加载该工具包。

3. 查看所包含的数据,用info()命令:

结果如下:

4.这里以肺癌为例,提取芯片的表达数据,用expressionTCGA函数进行提取:

结果如下:

5. 对感兴趣基因提取相应的表达量。

结果如下:

6. 这里同样以肺癌为例,提取RNAseq的表达数据,用expressionTCGA函数进行提取:

结果如下:

7. 对感兴趣基因提取相应的RNAseq表达量,注意提取感兴趣的基因需要输入格式为:Gene Symbol|Entrz ID

结果如下:

获得了这个矩阵,就表示你的数据下载成功了!

原文发布于微信公众号 - 百味科研芝士(keyanzhishi)

原文发表时间:2019-05-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券