首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据

前些天被TCGA的终结新闻刷屏,但是一直比较忙,还没来得及仔细研读,但是笔记本躺着的一些TCGA教程快发霉了,借此契机好好整理一下吧,预计二十篇左右的笔记 ——jimmy 往期目录如下: 使用R语言的...img 细心的同学可以发现,本教程其实里面含有大量的外链,因为微信自身的限制没办法跳转,大家可以去生信技能树论坛查看,谢谢合作哦。...一个R包不仅仅是提供一个数据下载接口,更重要的是里面封装了一些便于使用的统计分析函数。...生信技能树GATK4系列教程 GATK4的gvcf流程 你以为的可能不是你以为的 新鲜出炉的GATK4培训教材全套PPT,赶快下载学习吧 曾老湿最新私已:GATK4实战教程 GATK4的CNV流程...WES的CNV探究-conifer软件使用 单个样本NGS数据如何做拷贝数变异分析呢 肿瘤配对样本用varscan 做cnv分析 使用cnvkit来对大批量wes样本找cnv

8.8K52
您找到你想要的搜索结果了吗?
是的
没有找到

TCGA体细胞突变系列教程--胃癌

下载TCGA所有癌症的maf文件计算TMB 下载TCGA所有癌症的maf文件做signature分析 TCGA计划的4个找somatic mutation的软件使用体验 但是限于时间和知识背景,虽然代码方面问题不大...今天和大家一起探索TCGA数据中胃癌突变的情况。 今天的探索分为两个部分: 1.Mutation 1)数据下载 目前TCGA突变分析的数据vcf格式数据是受限的,所以我们这应用maf文件进行分析。...直接去TCGA官网下载数据也不难,都很容易,并且工具都在添加一些新的功能,比如最近添加的CNV的分析,举一反三的看ICGC的应用方式几乎和TCGA的应用方式是一样的。...注意:TCGA直接下载的maf文件第16列即为样品名(例如:TCGA-FP-A4BE-11A-11D-A24F-08),但是直接下载的临床数据的样本名(例:TCGA-FP-A4BE)是不同的,此处需要整理成一致后读入...渴望探索的小伙伴可以去TCGA的官网试试一样可以绘制出此图,点选即可。

9.3K41

使用GDC在线查看TCGA数据

GDC是Genomic Data Commons的缩写,是由美国国家癌症研究所NCI建立的一套癌症数据共享系统,整合包括TCGA在内的多个癌症数据库中的信息,提供了癌症数据的统一存储,管理,展示,将数据与世界范围内的癌症基因组学研究者共享...Foundation Medicine(FM) Clinical Proteomic Tumor Analysis Consortium(CPTAC) THe Cancer Genome Atlas(TCGA...当然,到目前为止,该数据库中最大的数据依然是来自TCGA的数据。 为了方便管理如果大量的数据,建立了一个统一的数据模型,如下所示 ?...最高层级为program,对应不同的数据来源,如TCGA, TARGET等;第二层为project, 代表一系列患者对应的;第三层为case,代表的是同一个患者的所有相关数据,包括SNV, CNV,基因表达谱等多种数据...点击project id可以查看summary信息,以TCGA-BRCA为例,示意如下 ? 2.

1.9K51

TCGA数据库在线使用

最近做培训时整理的一部分TCGA相关数据库的使用总结。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。...本文包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE...TCGA主站 ? TCGA分析了11,000个病人的33种肿瘤的7个不同层面的数据,共获得2.5 PB数据。 ? 意在解析癌症发生的分子接触、肿瘤的亚型和治疗靶点等。 ?...TCGA网站主要提供的是数据的浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要的数据,使用TCGA提供的工具下载,进一步分析。 ? ? ? ? ? ? ? ? ? ?...TCGA项目促成了不少的高水平文章,对这些文章的阅读是对癌症知识的学习,也可以很好的扩展研究思路。 ? 如果你需要帮助,WIKI是最好的伙伴。 ?

3.9K2016

TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手

通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据...这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。...更多的是关于这个数据库的网页使用介绍,我们生信工程师通常不需要,就不赘述了。...如果真的要把GTEx数据库的转录组表达矩阵和TCGA的进行比较,还需要一定程度的去除批次效应。 我以前在生信技能树多次讲解,这里也不再赘述。

9K62

TCGA的28篇教程-早期泛癌研究

长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的RTCGAToolbox...包获取TCGA数据 (FireBrowse portal)TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)TCGA的28篇教程- 数据下载就到此为止吧TCGA的28篇教程-...指定癌症查看感兴趣基因的表达量TCGA的28篇教程- 对TCGA数据库的任意癌症中任意基因做生存分析TCGA的28篇教程-整理GDC下载的xml格式的临床资料 TCGA的28篇教程-风险因子关联图-一个价值...1000但是迟到的答案 TCGA的28篇教程-数据挖掘三板斧之ceRNA TCGA的28篇教程-所有癌症的突变全景图 TCGA计划进行到现在,科学家们于2018年一次性发表了27篇泛癌症研究相关文章,...使用limma包的removeBatchEffect来处理。

3.6K31

R tips:使用TCGAbiolinks包下载TCGA数据

TCGA数据下载就易用性来说,RTCGA包应该更好用,且由于是已经下载好的数据,使用比较稳定。但是也由于是下载好的数据,不能保证数据都是全新的。...目前有两大类TCGA数据可供下载,一个是Legacy,主要是一些使用 GRCh37 (hg19) 和GRCh36 (hg18)的数据,另一个是harmonized数据,统一使用GRCh38 (hg38)...这两种的GDCquery的参数会有少许不同,这里主要以harmonized数据为主,下载TCGA-READ和TCGA-COAD项目的RNA-seq数据。...GDCdownload,由于TCGA的下载不是特别稳定,所以可以使用files.per.chunk定为一个值,几个文件打包为一个压缩文件来下载。...生存分析时根据基因的中位数将其分为High和Low,使用log-rank检验显著性,也可以使用cox回归。

2.7K31

TCGA数据挖掘 | Xena - TCGA数据下载

TCGA (The Cancer Genome Atlas)作为目前超常用的癌症基因信息的数据库,有多种肿瘤的表达谱数据,变异信息(mutation,copy number),甲基化信息以及临床信息(人口学信息...TCGA数据下载方式有很多种,本次简单介绍自己喜欢用的方式-使用UCSC xena 网站进行下载。...1,Xena官网 浏览器中输入网址 http://xena.ucsc.edu/ ,下拉找到Explore TCGA, GDC, and other public cancer genomics resources...2,选择GDC,然后进入TCGA数据队列列表 ? 其他数据集可根据需要自行常看。 3,选择数据集 下拉选择需要的队列,此处以BRCA为例 ?...4,查看数据 点击 GDC TCGA Breast Cancer (BRCA) ,进入BRCA数据集,查看有哪些数据 ? 5,下载所需数据 选择对应的文件链接,点击即可。

2.8K40

生信小技巧第8课,加上 TCGA的28篇教程- 批量下载TCGA所有数据

长期更新列表: 视频讲解-R爬取生信软件列表到思维导图 生信技巧第二课-使用markdown记录和分享笔记 生信技巧第3课-请你务必学好R语言 broad官网出品的 必须神器 IGV 资料大全,含视频...TCGA的28篇教程往期目录如下: 使用R语言的cgdsr包获取TCGA数据 TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 TCGA的28篇教程- 使用R语言的RTCGAToolbox...包获取TCGA数据 (复制http://v.qq.com/x/page/v0666qu5y66.html这个链接在浏览器打开观看,当然,腾讯视频会给你看一分钟广告,而且需要自己选择超高清观看哦!!!)...http://v.qq.com/x/page/v0666qu5y66.html 背景知识 需要有服务器,或者linux系统电脑,或者熟练Windows 掌握基本shell脚本及命令 需要学会安装软件 了解TCGA...如果中国大陆下载缓慢,可以使用我们的网盘链接: https://share.weiyun.com/56URQ3a 数据处理,见后续课程 腾讯课堂观看该视频,获得更好的体验哦:https://ke.qq.com

1.2K30

如何使用TCGAbiolinks下载TCGA数据并整理

引言 一般来讲,我们想要使用TCGA数据,大概有三种方法,一是直接从GDC官网或官方下载工具gdc-client下载文件后自行处理,二是使用数据库如UCSC Xena或Firehouse,三是使用TCGAbiolinks...图片 图片 图片 图片 图片 过程 下载 首先是更新最新版的 TCGAbiolinks 包, 我使用的办法是使用Clash获得本地代理后对 R session 进行代理流量转发, 而后直接运行 BiocManager...安装成功后,就可以开始使用了。...TCGAbiolinks:::getGDCprojects()$project_id %>% length() # [1] 74 如需获取TCGA癌症数据, 可以使用正则表达式获取开头带有 TCGA 的项目..."TCGA-CESC" "TCGA-PCPG" "TCGA-PAAD" "TCGA-MESO" "TCGA-TGCT" # [11] "TCGA-KIRP" "TCGA-UVM" "TCGA-UCS"

4.5K42

R语言TCGA-Assembler包下载TCGA数据

(4)使用TCGA-Assembler这个软件,需要能够直接在系统中调用Curl,对于我们使用Windows系统的童鞋来说,这也很简单,我们把TCGA-Assembler这个软件包解压后的curl.exe...(5)然后打开R软件,设置工作目录,直接使用代码:setwd(”E:/BioInfo/TCGA_Assembler") 来实现,输入这行代码后,可通过getwd()来获取当前工作目录,确认是否设置成功,...有关TCGA患者条码的信息,请参考https://wiki.nci.nih.gov/display/TCGA/TCGA+barcode。..."TCGA-G5-6572", "TCGA-F5-6812", "TCGA-AF-2692", "TCGA-AG-4021")) # 获取所有膀胱尿路上皮癌(BLCA)患者样本的拷贝数数据。...-A13F", "TCGA-AO-A12B", "TCGA-AR-A1AP", "TCGA-AR-A1AQ","TCGA-AR-A1AS", "TCGA-AR-A1AV", "TCGA-AR-A1AW"

4.5K30

TCGA的28篇教程- 对TCGA数据库的任意癌症中任意基因做生存分析

长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的RTCGAToolbox...包获取TCGA数据 (FireBrowse portal)TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)TCGA的28篇教程- 数据下载就到此为止吧 TCGA的28篇教程...- 指定癌症查看感兴趣基因的表达量 本教程目录: 首先使用cgdsr获取表达数据集临床信息 临床资料解读 简单的KM生存分析 有分类的KM生存分析 根据基因表达量对样本进行分组做生存分析 cox生存分析...只需要记住和熟练使用三个函数: Surv:用于创建生存数据对象 survfit:创建KM生存曲线或是Cox调整生存曲线 survdiff:用于不同组的统计检验 首先使用cgdsr获取表达数据集临床信息...既然是要说明如何对任意癌症的任意基因做生存分析,那么我们首先需要理解cgdsr下载TCGA任意数据的用法(见之前的教程),下面的例子是获取TCGA数据库的乳腺癌的BRCA1和BRCA2基因的表达,以及涉及到的病人的临床资料

44.7K1613
领券