前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TCGA的28篇教程-所以癌症的突变全景图

TCGA的28篇教程-所以癌症的突变全景图

作者头像
生信技能树
发布2018-09-21 16:32:00
5.3K1
发布2018-09-21 16:32:00
举报
文章被收录于专栏:生信技能树生信技能树

长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的RTCGAToolbox包获取TCGA数据 (FireBrowse portal)TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)TCGA的28篇教程- 数据下载就到此为止吧TCGA的28篇教程- 指定癌症查看感兴趣基因的表达量TCGA的28篇教程- 对TCGA数据库的任意癌症中任意基因做生存分析TCGA的28篇教程-整理GDC下载的xml格式的临床资料 TCGA的28篇教程-风险因子关联图-一个价值1000但是迟到的答案 TCGA的28篇教程-数据挖掘三板斧之ceRNA

通过前面的讲解我们都学会了如何下载TCGA数据库的各种数据,而且有心人都发现了下载途径多种多样,下载数据只是分析的起点,现在我们就讲解其中一个小应用哦。 数据来源于生信技能树前面讲解的TCGA的XENA 网盘链接: https://share.weiyun.com/56URQ3a

MAF格式的突变数据的全景图

有了MAF格式的突变数据,比如TCGA里面的乳腺癌的1000个左右的样本的突变信息,就很容易走maftool这个包,进行绘图,代码如下:

require(maftools)

options(stringsAsFactors = F)

laml = read.maf(maf = 'GDC/TCGA.BRCA.mutect.c6a029e5-0ea3-410d-9e67-360bdfee2914.DR-7.0.somatic.maf.gz',

clinicalData = 'TCGA_BRCA_filter_phe.tsv')

oncoplot(maf = laml, top = 30, fontSize = 12,

clinicalFeatures =c('ER','PR','HER2'),

sortByAnnotation = T)

就可以出图如下:

是不是觉得很神奇,简单几行代码就出了这么复杂的图!!!

代码里面的 somatic.maf.gz 文件直接下载即可。

但是TCGA_BRCA_filter_phe.tsv 这个文件需要自己根据TCGA里面对样本的描述的表型信息进行整理。

整理如下格式:

普通的人,用excel表格整理就好了。

会R的可以尝试R代码哦!

如果你不会整理,可以查看我们前面的教程:TCGA的28篇教程-整理GDC下载的xml格式的临床资料

自己的肿瘤外显子数据分析流程

当然,如果你是自己的测序数据,想得到跟TCGA的一样的突变数据,也可以根据下面的教程慢慢分析。

生信技能树GATK4系列教程

GATK4的gvcf流程

你以为的可能不是你以为的

新鲜出炉的GATK4培训教材全套PPT,赶快下载学习吧

曾老湿最新私已:GATK4实战教程

GATK4的CNV流程-hg38

然后是 CNV相关工具

WES的CNV探究-conifer软件使用

单个样本NGS数据如何做拷贝数变异分析呢

肿瘤配对样本用varscan 做cnv分析

使用cnvkit来对大批量wes样本找cnv

使用sequenza软件判定肿瘤纯度

还有vcf和maf的工具:

安装VEP及其注释数据库

肿瘤突变数据可视化神器-maftools

值得一提的是,教程虽然放在这里了,事实上你真正拿到数据实践的时候会遇到各种问题的,这就是目前主流的生信工程师的意义所在。

而且,maftools本身一个集成了很多肿瘤外显子下游分析的工具包,不仅仅是画全景图,希望你喜欢。

突变更重要的是分组

这么简单粗暴的查看某个癌症全部样本的突变全景图已经意义不大,毕竟本来就是公开的数据了,我们要想利用这些信息,必须结合自己的实际生物学问题。

比如你们可以看我GitHub里面的这3个代码,就是利用突变信息的一个非常棒的例子:

https://github.com/jmzeng1314/tcga_example

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-09-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档