小伙伴们大家好,肿瘤相关的生信文章绝大多数离不开TCGA数据库(https://portal.gdc.cancer.gov/)。但新手小白们可能对这个网站中的数据无从下手,或者仅仅知道寥寥几个相关网站还没能探索到相关的神奇功能。那么,我就来为大家总结一下TCGA生信挖掘必备的数据库合集吧!
一、最权威的网站资源
1
cBioPortal(http://www.cbioportal.org/)
一个基于TCGA数据库,不需要注册登录即可进行可视化分析的网页,不需要代码,里面内容十分丰富,提供了最详细的TCGA在线分析展示。
2
Oncomine(https://www.oncomine.org/resource/login.html)
Oncomine目前最大的癌症基因芯片数据库,里面不仅包含TCGA数据,还包括了其他有关的肿瘤的数据信息,非常全面。
3
GEPIA(http://gepia.cancer-pku.cn/)
一个国人开发的TCGA数据库极优可视化网站,重要的是操作简单快捷,小编力荐!包含了最全面的TCGA测序数据,能够可视化肿瘤与癌旁组织的基因表达量,还有生存分析等等,基本上你能想到的GEPIA都有。
4
UCSC Xena(https://xena.ucsc.edu/)
该数据库集合TCGA,ICGC资源于大成,可以零代码下载数据,也可以通过UCSCXenaTools工具包下载。该网站还单独设立了可视化平台(https://xenabrowser.net/heatmap/),包含129个队列的1570个数据集,只需要输入肿瘤数据集和目的基因,即可一秒绘制出可用于文章发表级别的基因差异表达热图,如下图所示:
还可以比较两数据集中目的基因的表达差异。
我们还可以对目的基因的不同转录本进行可视化。
5
Broad GDAC Firehose(http://gdac.broadinstitute.org/)
由美国MIT和Harvard共建的Broadinstitute运行的GDAC,提供较为完善的TCGA数据为基础的各类信息检索服务。
6
Fire Browse(http://firebrowse.org/)
该网站平台是由 Broad研究所开发的用于TCGA数据挖掘可视化的网络平台,提供基因表达,突变等综合挖掘分析功能,类似于cBioportal。
二、常用特异性TCGA可视化数据库
除上文的综合型数据库之外,还包括一些特异分析TCGA某一数据的数据库,我们下面就为大家简单介绍几个比较常用的TCGA个性化分析数据库。
1
比较全面的TCGA生存分析库——Oncolnc(http://www.oncolnc.org/)
该网络平台可以对TCGA的mRNA、miRNA、lncRNA进行分析。
2
基于TCGA的蛋白芯片分析神器TCPA(http://www.tcpaportal.org/tcpa/)
癌症蛋白质组图谱(TCPA)是一个侧重反相蛋白阵列(RPPA)的网站,反相蛋白阵列(RPPA)代表一种功能强大的功能性蛋白质组学方法,可以以经济有效,灵敏和高通量的方式在许多样本中评估相当数量的选定蛋白质标记。当前的RPPA平台包含大约300个蛋白质标记物,涵盖所有主要的癌症信号传导途径。
3
基于TCGA的甲基化神器mexpress(http://mexpress.be/)
在该网站平台,我们只需输入基因名+选择要研究的肿瘤即可,能够检索包括组织类型、肿瘤亚型、分子分型、甲基化等在内的因素与目的基因表达的关系。
4
肿瘤免疫浸润数据库TIMER(http://cistrome.dfci.harvard.edu/TIMER/)
TIMER(Tumor Immune Estimation Resource)是由哈佛大学免疫信息学教授刘小乐领导建立的一个网站工具,利用RNA-Seq表达谱数据检测肿瘤组织中免疫细胞的浸润情况。相较于TCIA展示了20种免疫细胞浸润比例,TIMER则提供6种免疫细胞(B cells, CD4+ T cells, CD8+ T cells, Neutrphils, Macrophages and Dendritic cells )的浸润情况。
今天为大家分别介绍了两大类TCGA相关数据库,从几大最权威的网站资源,到相关生存分析、lncRNA/miRNA/mRNA可视化分析,甲基化异及肿瘤免疫浸润分析等个性化TCGA相关数据库。除此之外,还有更多的TCGA相关数据库,小伙伴们在学习中可以多多积累,多多尝试,找到适合自己目的基因的数据库!