前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TCGA数据下载:R包TCGA2STAT介绍

TCGA数据下载:R包TCGA2STAT介绍

作者头像
努力在北京混出人样
发布2019-02-18 15:19:01
9820
发布2019-02-18 15:19:01
举报
文章被收录于专栏:祥子的故事

上期介绍了若干种获取TCGA数据的方法,今天这期会落点于TCGA2STAT这个R包的介绍上,一步步的来说明下载方法,哪些数据是可以下载到的。

R包的下载

代码语言:javascript
复制
install.packages("TCGA2STAT")

选择如何的镜像,咱们在中国,就选择china,这样的话下载速度会很快,也容易安装R包成功。

可下载的数据

1、 RNASeq ,默认是count类型,是指下载raw read counts数据。可以改为RPKM,是指下载normalized read counts数据 (reads per kilobase per million mapped reads)。

2、RNASeq2,是指来自the second pipeline的RNASeq基因数据。

3、miRNASeq,默认为count,是指下载raw read counts数据;可以改为rpmmm,是指下载normalized read counts。

4、Mutation,默认为smoatic,是指non-silent somatic mutations 数据;改为all,表示为all mutations数据。

5、Methylation,默认为来自platform为27K;platform可改为450K。

6、CNA_CGH,默认为415K,是指CGH Custom Microarray 2x415K ;可改为244A,是指 CGH Microarray。

7、mRNA_Array,默认为G450,是指Agilent 244K Custom Gene Expression G4502A ;可改为U133,只指Affymetrix Human Genome U133A 2.0 Array;还可以改为Huex,是指Affymetrix Human Exon 1.0。

下载格式

代码语言:javascript
复制
getTCGA(disease = "GBM", data.type = "RNASeq2", type = "", filter = "Y",
p = getOption("mc.cores", 2L), clinical = FALSE, cvars = "OS")

上面的参数的值都为默认情况下的,disease包括了33种,”ACC”, “BLCA”, “BRCA”, “CESC”, “CHOL”, “COAD”, “COADREAD”, “DLBC”,”ESCA”, “FPPP”, “GBM”, “GBMLGG”, “HNSC”, “KICH”, “KIPAN”, “KIRC”, “KIRP”, “LAML”, “LGG”,”LIHC”, “LUAD”, “LUSC”, “MESO”, “OV”, “PAAD”, “PCPG”, “PRAD”, “READ”, “SARC”, “SKCM”,”STAD”, “TGCT”, “THCA”, “THYM”, “UCEC”, “UCS”, and “UVM”。

根据TCGA官网给出的图,介绍了目前收集到的数据情况:

TCGA中各个癌症的数据
TCGA中各个癌症的数据

纵轴表示收集到的病例数。

  • 下面来举一个例子来说明数的下载:
代码语言:javascript
复制
library(TCGA2STAT)
BRCA <- getTCGA(disease = "BRCA", data.type
= "RNASeq",type = "count", clinical=TRUE)

如果在win系统下,会报错: Error: TAR is not installed in the system. Data unzip failed.

谷歌查到说需要安装Cygwin软件,然后通过R语言命令来加载,而且每次使用都必须做加载,命令如下:

代码语言:javascript
复制
Sys.setenv(TAR="D:/cygwin64/bin/tar",R_GZIPCMD="D:/cygwin64/bin/gzip")

个人见解

TCGA2STAT这个包下载数据效果太差,不稳定,时常没法下载完就中断了,及其不稳定。也许你所在地方刚好能很好的下载也说不定。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2016年10月13日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档