首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

TCGA数据库简介

TCGA全称如下 The Cancer Genome Atlas 是由National Cancer Institute ( NCI, 美国国家癌症研究所) 和 National Human Genome...Research Institute (NHGRI, 国家人类基因组研究所) 合作建立的癌症研究项目,通过收集整理癌症相关的各种组学数据,提供了一个大型的,免费的癌症研究参考数据库。...该数据库的网址如下 https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga 数据类型包括以下几种...目前针对TCGA的数据,常用的分析包括以下几种 生存分析 肿瘤患者和正常人的差异分析 组学数据和临床数据的相关性 基于TCGA等公共数据库的挖掘是目前研究的一个热点,在文章中也经常会使用TCGA的数据来和自己实际的数据相互映证...了解和掌握TCGA数据的用法势在必行,在后续文章中会详细介绍。

5.2K40
您找到你想要的搜索结果了吗?
是的
没有找到

TCGA数据库在线使用

最近做培训时整理的一部分TCGA相关数据库的使用总结。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。...不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。...本文包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE...TCGA主站 ? TCGA分析了11,000个病人的33种肿瘤的7个不同层面的数据,共获得2.5 PB数据。 ? 意在解析癌症发生的分子接触、肿瘤的亚型和治疗靶点等。 ?...TCGA网站主要提供的是数据的浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要的数据,使用TCGA提供的工具下载,进一步分析。 ? ? ? ? ? ? ? ? ? ?

3.9K2016

TCGA免疫浸润评价数据库

但是TIMER算法的作者,最近把TCGA所有癌症的RNA-seq的基于不同算法的结果都进行了运算,同时也把结果放到了网站上,这样我们就可以查各个算法当中具体的免疫情况。...今天我们就来介绍一个TIMER 2.0 (http://timer.cistrome.org/) 这个数据库。 PS:这个数据库有时候运行有点儿慢。 ?...免疫相关评价 在免疫相关评价这里,我们可以分析在TCGA当中:1. 基因表达和某一类免疫细胞的相关性; 2. 基因的突变对于和免疫情况的关系; 3. 基因拷贝数的变异和免疫细胞的相关性; 4....自己数据集免疫情况评估 这个数据库除了可以分析TCGA的现有数据之外,也是可以对自己的数据集进行免疫浸润分析的。...值得注意的是,上传的数据是TPM归一化的数据库。 ? 写到最后 以上就是这个数据库的所有内容了。基本上如果想要做TCGA研究的免疫浸润的话,可以通过这个数据库来查看。

1.5K30

TCGA数据库临床资料官方大全

因为TCGA计划跨时太长,纳入研究的病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整的系统性的公布了权威的临床资料。...## 来源于 XENA 数据源: # https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.survival.tsv.gz...在Xena的survival.tsv中定义的结局事件是死亡,在TCGA-CDR中,PFI.1定义的终点事件是疾病进展,包括死亡、复发、转移等。...具体到病人TCGA-BA-5151,他可能是在术后517天发现有肿瘤复发,第722天失访,那么在Xena的生存分析中是定义为722天截尾,但是在TCGA-CDR中是517天事件发生。...这一点在TCGA-CDR的表格文件中有解释 关于生存分析该选择哪个时间点 这不是一个选择题,既然人家TCGA组织整理了 four major clinical outcome endpoints.

4.7K41

TCGA、ICGC、GTEx 数据库都是啥?

我们在进行数据库介绍,尤其是肿瘤相关数据库的时候,经常会提到说这个使用了 TCGA/GTEx 数据库的数据,那么这两个数据库到底是什么呢?为什么会有用这两个数据库呢?...TCGA TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。为什么经常看到别人用这个数据库呢?...如果我们使用GEO数据库检索某一个癌种,同样也可以得到这些相关的数据。但是TCGA数据库珍贵的地方是,这个数据都是出自同一个人的。这样的话,我们就可以研究不同组学之间的交叉反应了。...这个数据库TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。 ?...这个数据库TCGA和ICGC不同的是。TCGA和ICGC更多的还是肿瘤相关的数据,而GTEx收集的是正常人身上的组织来进行的测序,所以GTEx数据库包括的就只是正常人的数据。

4K30

TCGA tRNA延伸片段数据库

因此对于我们常用的TCGA数据而言,由于TCGA做了miR-seq的数据,原理上来说,我们是可以获得到TCGA当中所有患者的tRFs的变化情况的。...所以今天就给大家推荐一个已经利用TCGA数据库分析好的tRFs数据库:OncotRF[http://bioinformatics.zju.edu.cn/OncotRF/index.html]。...数据库分析流程 通过以上的介绍其实已经了解了这个数据库是怎么进行分析的。对于数据的获取,这个数据库使用TCGA当中miR-seq的bam数据来进行重新比对。进而就可以获得tRFs的表达情况。...数据库使用场景 以上就是这个数据库的主要功能了。比较可惜的是作者没有提供所有原始数据下载的功能。不然的话,还可以下载所有的原始数据来进行自己的DIY分析。不过其实功能已经很全了。...研究tRFs的或者在使用TCGA挖掘数据没有新的思路的同学可以考虑一下这个tRFs。

53030

TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手

通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据...这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。...更多的是关于这个数据库的网页使用介绍,我们生信工程师通常不需要,就不赘述了。...注意一下 数据库的版本信息: The current release is V7 including 11,688 samples, 53 tissues and 714 donors 首先看数据库的注释信息...如果真的要把GTEx数据库的转录组表达矩阵和TCGA的进行比较,还需要一定程度的去除批次效应。 我以前在生信技能树多次讲解,这里也不再赘述。

9K62

TCGA数据库:miRNA数据下载与整理

TCGA官网:https://portal.gdc.cancer.gov/ 至于使用教程,可阅读之前的文章:TCGA数据库使用教程。...miRNA_ID:miRBase v21数据库中收录的miRNA名称 read_count:miRNA原始reads数,用于表达定量; reads_per_million_miRNA_mapped:每百万...然后我们就可以进行后续的分析了,比如: 差异分析:一文就会TCGA数据库基因表达差异分析。 与临床数据结合的分析:一个R脚本解决某类功能基因(比如m6A甲基化)临床预后模型分析流程.等。...此外,TCGA数据库中处理直接下载的miRNA-Seq之外,Gene Expression Quantification里面的RNA-Seq数据中也有非编码RNA的数据,比如lncRNA等。...我也把TCGA数据库33个Project的RNA-Seq转录组数据都处理好了,后续会介绍怎么处理

7.7K20

LinkedOmics | TCGA多组学关联分析数据库

之前我们介绍了很多TCGA方面的数据库。其中GEPIA只能用来分析表达数据库各个方面的。cBioPortal可以进行多组学分析,但是一般都是分析自身基因和自身突变等等的关系。...关于LinkedOmics而言,主要包括的还是TCGA的内置数据。由于是要做多组学的关联分析的,一定要对于TCGA数据包括哪些数据要有一定的认识。这样才能方便我们来进行交叉分析的。...关于TCGA数据库的话,这个数据库有一个简单的介绍。其中这个里面需要简单说明的是,在临床参数这个部分,这个数据库知识包括了一些传统的数据集比如:TNM分析、组织分型、预后信息等等。...在TCGA当中,乳腺癌的简称是BRCA。所以这里我们选择乳腺癌。 2.2 目标数据集选择 由于我们要进行miRNA的分析。所以这里我们首先要选择miRNA检测的数据。...具体这个数据库怎么操作可以查看我们第二个帖子。 数据库使用场景 以上就是这个数据库主要的使用场景。对于这个数据库,如果我们想要进行多组学交叉分析的时候还是挺有用的。

3.2K40

MEXPRESS:TCGA甲基化分析数据库

TCGA数据库是一个包括33种癌的各个组学的数据库。我们通过TCGA数据库可以观察每个人的基因表达的变化;甲基化的变化;拷贝数的变化;以及他们的临床信息。...MEXPRESS(https://mexpress.be/)是一个可视化TCGA数据库当中患者的临床信息—甲基化—表达之间之间关系的数据库。 ? 输入 这个数据库需要我们输入两个信息。...具体的统计方法可以查看数据库说明。 ? 聚焦 如果我们想要查看某一区域:比如CpG位点的甲基化变化情况。我们可以用鼠标选上那块区域。然后就可以聚焦查看这段区域的变化了。 ?...这个如果想要数据还是从TCGA官网下载吧。 数据库总结: 在TCGA数据甲基化分析方面分析而言,这个数据库做的相当可以了。不好的一点就是没有提供数据分析结果下载的地方。

2.5K20

TCGA数据库LUSC亚型批量差异分析

数据库中LUSC的转录组信号值矩阵,LUSC病人分成了4类T1-4亚型分别与Normal组做差异分析,就是3*4=12个表达矩阵,12次差异分析,画PCA图,热图,火山图,以及用于差异分析结果比较的Venn...下载数据 紧跟群主的TCGA视频课程,从UCSC的XENA下载LUSC表达矩阵,临床信息,探针注释GMT文件!...视频课程见:4个小时TCGA肿瘤数据库知识图谱视频教程又有学习笔记啦 rm(list = ls()) pd=read.table("TCGA-LUSC.GDC_phenotype.tsv.gz",header...TCGA数据库的样本编码规律:Tumor types range from 01 - 09, normal types from 10 - 19 and control samples from 20...DESeq2包分析的表达矩阵必须是count矩阵,TCGA数据库下载的表达矩阵需查看格式说明,如是否取log,如有需要转换回来。

1.4K30

TCGA数据库:miRNA数据下载与整理(2)

我前面有一篇介绍TCGA数据库中miRNA数据的下载与整理的文章【TCGA数据库:miRNA数据下载与整理】,在这篇文章中,我们下载的数据是 miRNA Expression Quantification...这个和前文【TCGA数据库:miRNA数据下载与整理】中一样的。 这里读入其中一个文件: filepath <- dir(path ="....【一文就会<em>TCGA</em><em>数据库</em>基因表达差异分析】,当然还有GDCRNATools包【<em>TCGA</em><em>数据库</em>:GDCRNATools包下载数据、处理数据以及差异分析】。...如果你想偷懒,那么你可以在一些<em>数据库</em>中直接下载,比如:GDAC Firehose<em>数据库</em>,以及UCSC<em>数据库</em>【UCSC<em>数据库</em>下载<em>TCGA</em>数据需要注意的细节】,但从UCSC下载的数据和我们前面处理的一样,是...代码在文章【<em>TCGA</em><em>数据库</em>:miRNA数据下载与整理】,以前付费过的,你回复文章中的关键词,重新获取。

5.7K10
领券