展开

关键词

TCGA数据库简介

TCGA全称如下 The Cancer Genome Atlas 是由National Cancer Institute ( NCI, 美国国家癌症研究所) 和 National Human Genome Research Institute (NHGRI, 国家人类基因组研究所) 合作建立的癌症研究项目,通过收集整理癌症相关的各种组学数据,提供了一个大型的,免费的癌症研究参考数据库。 该数据库的网址如下 https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga 数据类型包括以下几种 目前针对TCGA的数据,常用的分析包括以下几种 生存分析 肿瘤患者和正常人的差异分析 组学数据和临床数据的相关性 基于TCGA等公共数据库的挖掘是目前研究的一个热点,在文章中也经常会使用TCGA的数据来和自己实际的数据相互映证 了解和掌握TCGA数据的用法势在必行,在后续文章中会详细介绍。

3K40

TCGA蛋白分析数据库

该网站结合了反向蛋白质阵列(RPPA)和TCGA的蛋白质组数据库,可以后续结合TCGA的临床数据进行分析。 ? 每个体系都包括4个方面,基本操作一致,我们这里以肿瘤样本为例简要介绍一下该数据库的使用。 点击View details。 ? 进入,可以发现具体包含4个在线分析工具: ?

1.3K30
  • 广告
    关闭

    腾讯云图限时特惠0.99元起

    腾讯云图是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。新用户0.99元起,轻松搞定数据可视化

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    TCGA数据库在线使用

    最近做培训时整理的一部分TCGA相关数据库的使用总结。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。 不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。 本文包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE TCGA主站 ? TCGA分析了11,000个病人的33种肿瘤的7个不同层面的数据,共获得2.5 PB数据。 ? 意在解析癌症发生的分子接触、肿瘤的亚型和治疗靶点等。 ? TCGA网站主要提供的是数据的浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要的数据,使用TCGA提供的工具下载,进一步分析。 ? ? ? ? ? ? ? ? ? ?

    2.3K2016

    TCGA数据库详细介绍

    背景 TCGA(The cancer genome atlas,癌症基因组图谱)由 National Cancer Institute(NCI,美国国家癌症研究所) 和 National TCGA官网: 1. 数据等级和分类: TCGA存储的数据包括SNV、转录组分析、生物样本信息、原始测序数据、CNV、DNA甲基化、临床信息等。 在网页上方会显示出勾选条件,如下图所示,选择条件是TCGA-LIHC中用MuTect2 call出的原始体细胞变异的SNV文件,文件数量是378个,然后我们可以通过购物车按钮单个添加或全部添加到我们的下载清单中 3.如何下载数据: TCGA中的数据分为controlled和open,controlled数据需要申请账号才可以下载,open数据不需要账号。

    1.9K40

    TCGA数据库:生存分析

    options(stringsAsFactors = F) #加载表达数据 load("F:/TCGA/HTSeq-FPKM/Rdata/data/TCGA-COAD-Exp.Rdata") #加载临床数据 load("K:/TCGA/clinicalData/tidyAllCancerData/TCGA-COAD -Clindata.Rdata") 表达数据和临床数据,我之前已经上传到网盘 之前处理后的数据进行简单的处理 因为原来表达矩阵中病人的barcode长,"TCGA-AA-3662-11A-01R-1723-07",而临床数据中的只有前3段。

    2.3K32

    TCGA免疫浸润评价数据库

    但是TIMER算法的作者,最近把TCGA所有癌症的RNA-seq的基于不同算法的结果都进行了运算,同时也把结果放到了网站上,这样我们就可以查各个算法当中具体的免疫情况。 今天我们就来介绍一个TIMER 2.0 (http://timer.cistrome.org/) 这个数据库。 PS:这个数据库有时候运行有点儿慢。 ? 免疫相关评价 在免疫相关评价这里,我们可以分析在TCGA当中:1. 基因表达和某一类免疫细胞的相关性; 2. 基因的突变对于和免疫情况的关系; 3. 基因拷贝数的变异和免疫细胞的相关性; 4. 自己数据集免疫情况评估 这个数据库除了可以分析TCGA的现有数据之外,也是可以对自己的数据集进行免疫浸润分析的。 值得注意的是,上传的数据是TPM归一化的数据库。 ? 写到最后 以上就是这个数据库的所有内容了。基本上如果想要做TCGA研究的免疫浸润的话,可以通过这个数据库来查看。

    71230

    TCGA数据库临床资料官方大全

    因为TCGA计划跨时太长,纳入研究的病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整的系统性的公布了权威的临床资料。 ## 来源于 XENA 数据源: # https://gdc.xenahubs.net/download/TCGA-LAML/Xena_Matrices/TCGA-LAML.survival.tsv.gz 在Xena的survival.tsv中定义的结局事件是死亡,在TCGA-CDR中,PFI.1定义的终点事件是疾病进展,包括死亡、复发、转移等。 具体到病人TCGA-BA-5151,他可能是在术后517天发现有肿瘤复发,第722天失访,那么在Xena的生存分析中是定义为722天截尾,但是在TCGA-CDR中是517天事件发生。 这一点在TCGA-CDR的表格文件中有解释 关于生存分析该选择哪个时间点 这不是一个选择题,既然人家TCGA组织整理了 four major clinical outcome endpoints.

    3.6K40

    TCGA数据库中癌症名称缩写

    Neuroblastoma 神经母细胞瘤 TARGET-AML Acute Myeloid Leukemia 急性髓性白血病 TCGA-MESO Mesothelioma 间皮瘤 TCGA-ACC Adrenocortical Carcinoma 肾上腺皮质癌 TCGA-READ Rectum Adenocarcinoma 直肠腺癌 TCGA-LGG Brain Lower Grade Glioma Cancer Organoid Profiling 胰腺癌类器官分析 TCGA-BRCA Breast Invasive Carcinoma 乳腺浸润癌 TCGA-OV Ovarian Serous Kidney Chromophobe 肾染色体 TCGA-UVM Uveal Melanoma 葡萄膜黑色素瘤 TCGA-THYM Thymoma 胸腺瘤 TCGA-TGCT Testicular Germ 结肠腺癌 TCGA-LUAD Lung Adenocarcinoma 肺腺癌 TCGA-CESC Cervical Squamous Cell Carcinoma and Endocervical

    1.6K30

    TCGA tRNA延伸片段数据库

    因此对于我们常用的TCGA数据而言,由于TCGA做了miR-seq的数据,原理上来说,我们是可以获得到TCGA当中所有患者的tRFs的变化情况的。 所以今天就给大家推荐一个已经利用TCGA数据库分析好的tRFs数据库:OncotRF[http://bioinformatics.zju.edu.cn/OncotRF/index.html]。 数据库分析流程 通过以上的介绍其实已经了解了这个数据库是怎么进行分析的。对于数据的获取,这个数据库使用TCGA当中miR-seq的bam数据来进行重新比对。进而就可以获得tRFs的表达情况。 数据库使用场景 以上就是这个数据库的主要功能了。比较可惜的是作者没有提供所有原始数据下载的功能。不然的话,还可以下载所有的原始数据来进行自己的DIY分析。不过其实功能已经很全了。 研究tRFs的或者在使用TCGA挖掘数据没有新的思路的同学可以考虑一下这个tRFs。

    11830

    TCGA、ICGC、GTEx 数据库都是啥?

    我们在进行数据库介绍,尤其是肿瘤相关数据库的时候,经常会提到说这个使用了 TCGA/GTEx 数据库的数据,那么这两个数据库到底是什么呢?为什么会有用这两个数据库呢? TCGA TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。为什么经常看到别人用这个数据库呢? 如果我们使用GEO数据库检索某一个癌种,同样也可以得到这些相关的数据。但是TCGA数据库珍贵的地方是,这个数据都是出自同一个人的。这样的话,我们就可以研究不同组学之间的交叉反应了。 这个数据库TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。 ? 这个数据库TCGA和ICGC不同的是。TCGA和ICGC更多的还是肿瘤相关的数据,而GTEx收集的是正常人身上的组织来进行的测序,所以GTEx数据库包括的就只是正常人的数据。

    2.1K30

    TCGA数据库:miRNA数据下载与整理

    TCGA官网:https://portal.gdc.cancer.gov/ 至于使用教程,可阅读之前的文章:TCGA数据库使用教程。 miRNA_ID:miRBase v21数据库中收录的miRNA名称 read_count:miRNA原始reads数,用于表达定量; reads_per_million_miRNA_mapped:每百万 然后我们就可以进行后续的分析了,比如: 差异分析:一文就会TCGA数据库基因表达差异分析。 与临床数据结合的分析:一个R脚本解决某类功能基因(比如m6A甲基化)临床预后模型分析流程.等。 此外,TCGA数据库中处理直接下载的miRNA-Seq之外,Gene Expression Quantification里面的RNA-Seq数据中也有非编码RNA的数据,比如lncRNA等。 我也把TCGA数据库33个Project的RNA-Seq转录组数据都处理好了,后续会介绍怎么处理

    5K20

    TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手

    通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据 这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。 更多的是关于这个数据库的网页使用介绍,我们生信工程师通常不需要,就不赘述了。 注意一下 数据库的版本信息: The current release is V7 including 11,688 samples, 53 tissues and 714 donors 首先看数据库的注释信息 如果真的要把GTEx数据库的转录组表达矩阵和TCGA的进行比较,还需要一定程度的去除批次效应。 我以前在生信技能树多次讲解,这里也不再赘述。

    7.4K61

    LinkedOmics | TCGA多组学关联分析数据库

    之前我们介绍了很多TCGA方面的数据库。其中GEPIA只能用来分析表达数据库各个方面的。cBioPortal可以进行多组学分析,但是一般都是分析自身基因和自身突变等等的关系。 关于LinkedOmics而言,主要包括的还是TCGA的内置数据。由于是要做多组学的关联分析的,一定要对于TCGA数据包括哪些数据要有一定的认识。这样才能方便我们来进行交叉分析的。 关于TCGA数据库的话,这个数据库有一个简单的介绍。其中这个里面需要简单说明的是,在临床参数这个部分,这个数据库知识包括了一些传统的数据集比如:TNM分析、组织分型、预后信息等等。 在TCGA当中,乳腺癌的简称是BRCA。所以这里我们选择乳腺癌。 2.2 目标数据集选择 由于我们要进行miRNA的分析。所以这里我们首先要选择miRNA检测的数据。 具体这个数据库怎么操作可以查看我们第二个帖子。 数据库使用场景 以上就是这个数据库主要的使用场景。对于这个数据库,如果我们想要进行多组学交叉分析的时候还是挺有用的。

    81140

    python快速下载TCGA数据库相关数据

    TCGA是由National Cancer Institute ( NCI, 美国国家癌症研究所) 和 National Human Genome Research Institute (NHGRI, 国家人类基因组研究所) 合作建立的癌症研究项目,通过收集整理癌症相关的各种组学数据,提供了一个大型的,免费的癌症研究参考数据库。 这一次的学习笔记,主要是写用python快速下载TCGA数据库相关数据。我自己尝试后的优点是:快速(大概三分钟就可以下载完毕);下载的数据与官网GDC下载的相同。

    65820

    TCGA数据库免疫相关文件下载大全

    文章对TCGA中33种癌症,超过10,000个肿瘤样本进行了免疫原性分析,将所有肿瘤分成6种免疫亚型,即: wound healing IFN-γ dominant inflammatory lymphocyte .20170308.tsv panimmune_cytokine_network_all_edges_july202018.tsv merged_sample_quality_annotations.tsv tcga.pancan.igh.div.txt PanCanAtlas_miRNA_sample_information_list.txt ViralListForBBT.tsv TCGA_PCA.mc3.v0.2.8.CONTROLLED.filtered.sample_neoantigens _10062017.tsv TCGA.HRD_withSampleID.txt SYGNAL_immune_subtype_network_att.txt TCGA_all_leuk_estimate.masked 必须看我们的TCGA系列视频课程啊!

    77341

    MEXPRESS:TCGA甲基化分析数据库

    TCGA数据库是一个包括33种癌的各个组学的数据库。我们通过TCGA数据库可以观察每个人的基因表达的变化;甲基化的变化;拷贝数的变化;以及他们的临床信息。 MEXPRESS(https://mexpress.be/)是一个可视化TCGA数据库当中患者的临床信息—甲基化—表达之间之间关系的数据库。 ? 输入 这个数据库需要我们输入两个信息。 具体的统计方法可以查看数据库说明。 ? 聚焦 如果我们想要查看某一区域:比如CpG位点的甲基化变化情况。我们可以用鼠标选上那块区域。然后就可以聚焦查看这段区域的变化了。 ? 这个如果想要数据还是从TCGA官网下载吧。 数据库总结: 在TCGA数据甲基化分析方面分析而言,这个数据库做的相当可以了。不好的一点就是没有提供数据分析结果下载的地方。

    1.3K20

    虽然TCGA数据库有33种癌症

    TCGA Acute Myeloid Leukemia (LAML) (15 datasets) GDC TCGA Adrenocortical Cancer (ACC) (14 datasets) GDC TCGA Bile Duct Cancer (CHOL) (14 datasets) GDC TCGA Bladder Cancer (BLCA) (14 datasets) GDC TCGA Breast Cancer (BRCA) (20 datasets) GDC TCGA Cervical Cancer (CESC) (14 datasets) GDC TCGA Colon Cancer datasets) GDC TCGA Melanoma (SKCM) (14 datasets) GDC TCGA Mesothelioma (MESO) (14 datasets) GDC TCGA ) GDC TCGA Thymoma (THYM) (14 datasets) GDC TCGA Thyroid Cancer (THCA) (14 datasets) GDC TCGA Uterine

    17320

    TCGA数据库LUSC亚型批量差异分析

    数据库中LUSC的转录组信号值矩阵,LUSC病人分成了4类T1-4亚型分别与Normal组做差异分析,就是3*4=12个表达矩阵,12次差异分析,画PCA图,热图,火山图,以及用于差异分析结果比较的Venn 下载数据 紧跟群主的TCGA视频课程,从UCSC的XENA下载LUSC表达矩阵,临床信息,探针注释GMT文件! 视频课程见:4个小时TCGA肿瘤数据库知识图谱视频教程又有学习笔记啦 rm(list = ls()) pd=read.table("TCGA-LUSC.GDC_phenotype.tsv.gz",header TCGA数据库的样本编码规律:Tumor types range from 01 - 09, normal types from 10 - 19 and control samples from 20 DESeq2包分析的表达矩阵必须是count矩阵,TCGA数据库下载的表达矩阵需查看格式说明,如是否取log,如有需要转换回来。

    92630

    使用curatedTCGAData下载TCGA数据库信息好用吗

    好久没有写TCGA数据库教程了,因为TCGA计划早在2017年就陆陆续续停止了,我那个时候写了几百个教程并且录制了视频。 数据库有哪些数据 代码如下: > curatedTCGAData(diseaseCode = "*", assays = "*", dry.run = TRUE) Please see the list //accmae_sampleMap.csv" 实战 比如提取TCGA数据库的BRCA数据集的TNBC亚型的表达量矩阵。 前面我们提到过,如果是下载甲基化信号值矩阵或者表达量矩阵,会耗时很长。 LIVING TCGA-A1-A0SE Positive Positive Negative LIVING TCGA-A1-A0SF Positive TCGA-A1-A0SH Negative Positive Negative LIVING 整体评价:用起来还行,但也不是非他不可!

    31420

    相关产品

    • 数据库

      数据库

      腾讯云数据库(TencentDB)是腾讯提供的高可靠、高可用、可弹性伸缩的云数据库服务产品的总称。可轻松运维主流开源及商业数据库,它更拥有容灾、数据传输服务、安全服务、灾备和智能 DBA 等全套服务。 可提供于电商、金融、游戏、互联网等不同场景完美的解决方案。

    相关资讯

    热门标签

    活动推荐

    扫码关注腾讯云开发者

    领取腾讯云代金券