首页
学习
活动
专区
工具
TVP
发布

TCGA数据库在线使用

最近做培训时整理一部分TCGA相关数据库使用总结。在线数据库更新改版都比较快,使用时需要参照最新线上数据教程。...不过癌症相关数据库操作起来也都比较类似,输入一个或多个关注目的基因,查看基因功能注释,基因在哪些样品中存在突变,突变位点分布,共表达网络,生存分析等。...本文包括了TCGA本站中数据浏览、下载,尤其是TCGA改版后功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供分析类型最多一个平台,再是FIREBROWSE...TCGA主站 ? TCGA分析了11,000个病人33种肿瘤7个不同层面的数据,共获得2.5 PB数据。 ? 意在解析癌症发生分子接触、肿瘤亚型和治疗靶点等。 ?...TCGA网站主要提供是数据浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要数据,使用TCGA提供工具下载,进一步分析。 ? ? ? ? ? ? ? ? ? ?

3.9K2016

TCGA28篇教程-GTEx数据库-TCGA数据挖掘好帮手

通常我们在挖掘TCGA数据库时候,会发现该项目纳入正常组织测序结果是非常少,也就是说很多病人都不会有他正常组织转录组测序结果,比如说乳腺癌吧,1200个左右转录组数据,其中1100左右都是肿瘤组织测序数据...这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。...更多是关于这个数据库网页使用介绍,我们生信工程师通常不需要,就不赘述了。...注意一下 数据库版本信息: The current release is V7 including 11,688 samples, 53 tissues and 714 donors 首先看数据库注释信息...如果真的要把GTEx数据库转录组表达矩阵和TCGA进行比较,还需要一定程度去除批次效应。 我以前在生信技能树多次讲解,这里也不再赘述。

9K62
您找到你想要的搜索结果了吗?
是的
没有找到

TCGA28篇教程- 使用R语言RTCGA包获取TCGA数据

前些天被TCGA终结新闻刷屏,但是一直比较忙,还没来得及仔细研读,但是笔记本躺着一些TCGA教程快发霉了,借此契机好好整理一下吧,预计二十篇左右笔记 ——jimmy 往期目录如下: 使用R语言...正文 TCGA数据源 众所周知,TCGA数据库是目前最综合全面的癌症病人相关组学数据库,包括测序数据有: DNA Sequencing miRNA Sequencing Protein Expression...RTCGA.CNV RTCGA.methylation 这里就介绍如何使用R语言RTCGA包来获取任意TCGA数据吧。...img 细心同学可以发现,本教程其实里面含有大量外链,因为微信自身限制没办法跳转,大家可以去生信技能树论坛查看,谢谢合作哦。...生信技能树GATK4系列教程 GATK4gvcf流程 你以为可能不是你以为 新鲜出炉GATK4培训教材全套PPT,赶快下载学习吧 曾老湿最新私已:GATK4实战教程 GATK4CNV流程

8.7K52

TCGA28篇教程- 使用R语言RTCGAToolbox包获取TCGA数据

前些天被TCGA终结新闻刷屏,但是一直比较忙,还没来得及仔细研读,但是笔记本躺着一些TCGA教程快发霉了,借此契机好好整理一下吧,预计28篇教程!...——jimmy 往期目录如下: 使用R语言cgdsr包获取TCGA数据 TCGA28篇教程- 使用R语言RTCGA包获取TCGA数据 ?...第二篇目录 TCGA数据源 背景知识 了解并获取FireBrowse数据 了解从FireBrowse下载到S4对象 5大分析方法 优缺点分析 众所周知,TCGA数据库是目前最综合全面的癌症病人相关组学数据库...Expression DNA Methylation Copy Number 知名肿瘤研究机构都有着自己TCGA数据库探索工具,比如: Broad Institute FireBrowse portal...而第二个不同时间,指的是TCGA数据库在发展过程中样本量增加, 而FireBrowse是按照时间来定期运行程序处理数据,所以一般来说用最新版结果,就会涵盖TCGA里面的所有的样本了。

2.6K31

TCGA28篇教程- 对TCGA数据库任意癌症中任意基因做生存分析

长期更新列表: 使用R语言cgdsr包获取TCGA数据(cBioPortal)TCGA28篇教程- 使用R语言RTCGA包获取TCGA数据 (离线打包版本)TCGA28篇教程- 使用R语言RTCGAToolbox...包获取TCGA数据 (FireBrowse portal)TCGA28篇教程- 批量下载TCGA所有数据 ( UCSC XENA)TCGA28篇教程- 数据下载就到此为止吧 TCGA28篇教程...- 指定癌症查看感兴趣基因表达量 本教程目录: 首先使用cgdsr获取表达数据集临床信息 临床资料解读 简单KM生存分析 有分类KM生存分析 根据基因表达量对样本进行分组做生存分析 cox生存分析...只需要记住和熟练使用三个函数: Surv:用于创建生存数据对象 survfit:创建KM生存曲线或是Cox调整生存曲线 survdiff:用于不同组统计检验 首先使用cgdsr获取表达数据集临床信息...既然是要说明如何对任意癌症任意基因做生存分析,那么我们首先需要理解cgdsr下载TCGA任意数据用法(见之前教程),下面的例子是获取TCGA数据库乳腺癌BRCA1和BRCA2基因表达,以及涉及到病人临床资料

44.5K1613

TCGA数据库简介

Research Institute (NHGRI, 国家人类基因组研究所) 合作建立癌症研究项目,通过收集整理癌症相关各种组学数据,提供了一个大型,免费癌症研究参考数据库。...该数据库网址如下 https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga 数据类型包括以下几种...同时还有很多第三方工具,比如 cBioPortal ForeBrowse UCSC Xena 官方工具主要功能是查看和下载数据,只有非常简单分析功能,而第三方工具则侧重于基于TCGA数据进行分析...目前针对TCGA数据,常用分析包括以下几种 生存分析 肿瘤患者和正常人差异分析 组学数据和临床数据相关性 基于TCGA等公共数据库挖掘是目前研究一个热点,在文章中也经常会使用TCGA数据来和自己实际数据相互映证...了解和掌握TCGA数据用法势在必行,在后续文章中会详细介绍。

5.1K40

使用curatedTCGAData下载TCGA数据库信息好用吗

好久没有写TCGA数据库教程了,因为TCGA计划早在2017年就陆陆续续停止了,我那个时候写了几百个教程并且录制了视频。...请先通读文档后再发问 我这边备份TCGA数据来源于xena,ucsc,都在,https://share.weiyun.com/5zLnKmO 安装和加载R包相信已经无需我多说了: BiocManager...联网下载数据 可以使用 dry.run 控制是否真的下载,因为如果是下载甲基化信号值矩阵或者表达量矩阵,会耗时很长。...//accmae_sampleMap.csv" 实战 比如提取TCGA数据库BRCA数据集TNBC亚型表达量矩阵。 前面我们提到过,如果是下载甲基化信号值矩阵或者表达量矩阵,会耗时很长。...写在后面 写完教程才发现居然是没有图片,所以我就借用了2019年3月这个文章《TACCO, a Database Connecting Transcriptome Alterations, Pathway

91720

TCGA蛋白分析数据库

功能蛋白质组学是对蛋白质在功能活性水平(例如表达和修饰)大规模研究。对诸如癌症等复杂疾病研究表明,遗传改变并不能说明该疾病所有原因。...该网站结合了反向蛋白质阵列(RPPA)和TCGA蛋白质组数据库,可以后续结合TCGA临床数据进行分析。 ?...每个体系都包括4个方面,基本操作一致,我们这里以肿瘤样本为例简要介绍一下该数据库使用。 点击View details。 ? 进入,可以发现具体包含4个在线分析工具: ?...My Protein 蛋白在所有癌症分布。下表显示了蛋白质详细信息,包括相应基因、验证方式和抗体来源等。 ?...下面是小编随意点几张结果图片来具体展示。大家需要时候,输入自己想要查询蛋白即可。 ? ? ? ?

3.6K30

TCGA数据库详细介绍

背景 TCGA(The cancer genome atlas,癌症基因组图谱)由 National Cancer Institute(NCI,美国国家癌症研究所) 和 National...TCGA官网: 1. 数据等级和分类: TCGA存储数据包括SNV、转录组分析、生物样本信息、原始测序数据、CNV、DNA甲基化、临床信息等。...(1)会把所有的Project全部列出,然后点击自己需要ProjectID;(2)会列出所有的case,在左侧导航栏可以选择自己需要条件,然后点击自己需要ProjectID;(3)可以直接搜索ProjectID...在网页上方会显示出勾选条件,如下图所示,选择条件是TCGA-LIHC中用MuTect2 call出原始体细胞变异SNV文件,文件数量是378个,然后我们可以通过购物车按钮单个添加或全部添加到我们下载清单中...3.如何下载数据: TCGA数据分为controlled和open,controlled数据需要申请账号才可以下载,open数据不需要账号。

10.2K52

TCGA数据库:生存分析

options(stringsAsFactors = F) #加载表达数据 load("F:/TCGA/HTSeq-FPKM/Rdata/data/TCGA-COAD-Exp.Rdata") #加载临床数据...load("K:/TCGA/clinicalData/tidyAllCancerData/TCGA-COAD -Clindata.Rdata") 表达数据和临床数据,我之前已经上传到网盘 之前处理后数据进行简单处理...因为原来表达矩阵中病人barcode长,"TCGA-AA-3662-11A-01R-1723-07",而临床数据中只有前3段。...然后我们将表达矩阵与临床数据融合,因为不是每个病人数据都是一一对应,简单说,就是病人有表达数据,但他临床数据就不全,我们也删除了缺失值病人临床数据,所以我们只需要具有临床数据又有表达数据病人数据...尽管本文是介绍基因表达量生存分析,但其他也是一样,就看你怎么分组,比如我们前面介绍SNP数据处理后,能否做某基因突变与野生型生存分析呢?其实都是一样道理,其他也是一样。

4.3K42

使用TCGAbiolinks下载TCGA数据

TCGAbiolinks是一个分析处理TCGA数据R包,通过GDC API来查询和下载TCGA数据,同时提供了差异分析,生存分析,富集分析等常见分析功能,网址如下 http://bioconductor.org...Query 和在线查询类似,只不过是将网页上各种可选属性变成了对应参数,基本用法如下所示 ?...这里分成了两个步骤,第一步从GDC下载原始数据,可以使用API或者gdc-clinet进行下载, API速度相对快一点;第二步对原始数据结果进行整理,从GDC下载原始数据是每个文件单独分开,需要先对结果进行整理...以表达谱数据为例,需要进行样本合并,样本ID转换等,所有这些都可以通过GDCprepare完成。 整理好结果存放在data对象中, 样本信息可以通过如下方式进行查看 ? 结果示意如下 ?...表达量矩阵信息查看方式如下 ? 结果示意如下 ? 数据下载并整理好之后,就可以进行分析了。不同类型数据对应分析方法也不同,具体分析方法请参考官方文档。

1.3K21

TCGA免疫浸润评价数据库

前段时间随着肿瘤免疫热度,也有人试着开始利用RNA-seq这样数据来评价患者免疫情况。 基本过程也就是我们提供RNA-seq数据。然后使用相对应算法来评估每个样本免疫浸润程度。 ?...但是TIMER算法作者,最近把TCGA所有癌症RNA-seq基于不同算法结果都进行了运算,同时也把结果放到了网站上,这样我们就可以查各个算法当中具体免疫情况。...作者使用是edgr来分析差异表达结果。我们需要做就是选择目标基因即可,结果是以箱式图方式进行呈现。 ? 2.基因在泛癌当中预后情况。...自己数据集免疫情况评估 这个数据库除了可以分析TCGA现有数据之外,也是可以对自己数据集进行免疫浸润分析。...值得注意是,上传数据是TPM归一化数据库。 ? 写到最后 以上就是这个数据库所有内容了。基本上如果想要做TCGA研究免疫浸润的话,可以通过这个数据库来查看。

1.5K30

TCGA28篇教程-早期泛癌研究

长期更新列表: 使用R语言cgdsr包获取TCGA数据(cBioPortal)TCGA28篇教程- 使用R语言RTCGA包获取TCGA数据 (离线打包版本)TCGA28篇教程- 使用R语言RTCGAToolbox...包获取TCGA数据 (FireBrowse portal)TCGA28篇教程- 批量下载TCGA所有数据 ( UCSC XENA)TCGA28篇教程- 数据下载就到此为止吧TCGA28篇教程-...指定癌症查看感兴趣基因表达量TCGA28篇教程- 对TCGA数据库任意癌症中任意基因做生存分析TCGA28篇教程-整理GDC下载xml格式临床资料 TCGA28篇教程-风险因子关联图-一个价值...1000但是迟到答案 TCGA28篇教程-数据挖掘三板斧之ceRNA TCGA28篇教程-所有癌症突变全景图 TCGA计划进行到现在,科学家们于2018年一次性发表了27篇泛癌症研究相关文章,...使用limma包removeBatchEffect来处理。

3.6K31

TCGA体细胞突变系列教程--胃癌

下载TCGA所有癌症maf文件计算TMB 下载TCGA所有癌症maf文件做signature分析 TCGA计划4个找somatic mutation软件使用体验 但是限于时间和知识背景,虽然代码方面问题不大...今天和大家一起探索TCGA数据中胃癌突变情况。 今天探索分为两个部分: 1.Mutation 1)数据下载 目前TCGA突变分析数据vcf格式数据是受限,所以我们这应用maf文件进行分析。...直接去TCGA官网下载数据也不难,都很容易,并且工具都在添加一些新功能,比如最近添加CNV分析,举一反三看ICGC应用方式几乎和TCGA应用方式是一样。...注意:TCGA直接下载maf文件第16列即为样品名(例如:TCGA-FP-A4BE-11A-11D-A24F-08),但是直接下载临床数据样本名(例:TCGA-FP-A4BE)是不同,此处需要整理成一致后读入...渴望探索小伙伴可以去TCGA官网试试一样可以绘制出此图,点选即可。

9.2K41

生物信息数据分析教程视频——07-TCGA数据库:基因表达探索

参考文章: 【0代码】单基因泛癌分析教程 视频中代码: # setwd("H:/MedBioInfoCloud/analysis/TCGA/new/conventionalAnalysis") options...") ###TCGA数据库中33中癌症类型 project <- getGDCprojects()$project_id project <- project[grep("TCGA-",project...)] # ###在TCGA中没有正常样本,但可以匹配GTEx数据库正常样本癌症类型 # proj4 <- c("TCGA-ACC","TCGA-LGG","TCGA-OV","TCGA-SKCM...","TCGA-TGCT","TCGA-UCS" ) # ###在TCGA中正常样本大于0小于10,但可以匹配GTEx数据库正常样本癌症类型 # proj5 <- c("TCGA-CESC","TCGA-GBM...","TCGA-PAAD") # # ###在TCGA中正常样本大于0小于10,在GTEx数据库中也没有正常样本癌症类型 # proj6 <- c("TCGA-PCPG","TCGA-SARC","

63420

TCGA数据库临床资料官方大全

因为TCGA计划跨时太长,纳入研究病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整系统性公布了权威临床资料。...题外话:关于不同数据源TCGA临床资料冲突讨论 关于生存分析冲突问题,我们多次讨论了: 集思广益-生存分析可以随心所欲根据表达量分组吗 寻找生存分析最佳基因表达分组阈值 比如下面的代码比较两个数据源...在Xenasurvival.tsv中定义结局事件是死亡,在TCGA-CDR中,PFI.1定义终点事件是疾病进展,包括死亡、复发、转移等。...具体到病人TCGA-BA-5151,他可能是在术后517天发现有肿瘤复发,第722天失访,那么在Xena生存分析中是定义为722天截尾,但是在TCGA-CDR中是517天事件发生。...这一点在TCGA-CDR表格文件中有解释 关于生存分析该选择哪个时间点 这不是一个选择题,既然人家TCGA组织整理了 four major clinical outcome endpoints.

4.7K41

TCGA tRNA延伸片段数据库

所以今天就给大家推荐一个已经利用TCGA数据库分析好tRFs数据库:OncotRF[http://bioinformatics.zju.edu.cn/OncotRF/index.html]。...数据库分析流程 通过以上介绍其实已经了解了这个数据库是怎么进行分析。对于数据获取,这个数据库使用TCGA当中miR-seqbam数据来进行重新比对。进而就可以获得tRFs表达情况。...数据库使用 数据库主要提供了四种使用方式:tRFs基本检索;具体肿瘤类型所有结果预览;自定义分组比较以及预后分析 基本检索 假如我们有一个目标的tRF想要进行分析。就可以使用这个功能来进行定向检索。...这里绘图设置也是可以进行不同cutoff设置。同时也可以选择不同亚组进行分析。 数据库使用场景 以上就是这个数据库主要功能了。比较可惜是作者没有提供所有原始数据下载功能。...不然的话,还可以下载所有的原始数据来进行自己DIY分析。不过其实功能已经很全了。研究tRFs或者在使用TCGA挖掘数据没有新思路同学可以考虑一下这个tRFs。

52030

TCGA数据库中癌症名称缩写

Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督一个项目,旨在应用高通量基因组分析技术,以帮助人们对癌症有个更好认知...,从而提高对于癌症预防、诊断和治疗能力。...上图就是从TCGA官网截取,显示目前一共有63个项目。可以点击箭头所指Projects,获取具体63个癌症项目的名称,如下图所示。 ? 除了从官网直接下载以外,我们也可以用R代码来获取。...用到还是我们前面用来获取临床信息那个R包,TCGAbiolinks。TCGAbiolinks获取癌症临床信息 if (!...具体信息如下: id name 翻译 TCGA-SARC Sarcoma 肉瘤 TARGET-CCSK Clear Cell Sarcoma of the Kidney 肾脏透明细胞肉瘤 TARGET-NBL

4K30
领券