前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >maftools包分析突变数据,绘制瀑布图

maftools包分析突变数据,绘制瀑布图

作者头像
生信交流平台
发布2022-09-21 19:29:47
1K0
发布2022-09-21 19:29:47
举报
文章被收录于专栏:用户7627119的专栏

前面给大家介绍了MAF文件格式

MAF格式(mutation annotation format)

以及如何从TCGA数据库下载MAF格式的突变数据。

如何从TCGA数据库下载体细胞突变数据(somatic mutation)

今天我们来讲讲,怎么用R的maftools包来分析MAF格式的突变数据,并用瀑布图来展示结果。maftools这个包的主要分为两部分功能,分析和可视化。下图列出了,这个包中相应的函数的名字。

我们先用maftools包自带的数据,给大家讲解这个包的使用方法。后面再来实战,重现SCI文章中的瀑布图。

代码语言:javascript
复制
#安装maftools包
BiocManager::install("maftools")
#加载maftools包
library(maftools)
#指定maf文件的路径和名字
laml.maf = system.file('extdata', 'tcga_laml.maf.gz', package = 'maftools') 
#读取maf文件
laml = read.maf(maf = laml.maf, clinicalData = laml.clin)
#输出对象
laml

我们可以看到laml里面存的是一个MAF的对象,以及各种突变的统计信息

接下来我们可以对所有样本里面突变的summary信息进行可视化

代码语言:javascript
复制
pdf(file="maf_summary.pdf",width =12,height=7)
plotmafSummary(maf = laml,addStat = 'median')
dev.off()

我们会得到下面的一张突变的汇总图,包括各种突变分类统计图,突变类型统计图,碱基改变统计图,每个样本包含突变数统计图,样本中各种突变分类的箱型图,突变最多的10个基因所包含的突变类型,以及样本占比情况。

接下来我们就可以来绘制瀑布图了,我们可以通过top来控制展示多少个突变最多的基因,这里展示20个突变最多的基因。

代码语言:javascript
复制
pdf(file="oncoplot.pdf",width =12,height=7)
oncoplot(maf = laml, top = 20)
dev.off()

我们可以得到下面这张瀑布图

这张图最上面展示的是每个样本的TMB(tumor mutation burden,肿瘤突变负荷),每兆碱基(每1百万个碱基)中体细胞突变的数目。TMB可以作为一种新兴肿瘤免疫治疗生物标志物。中间类似瀑布的部分展示的是每个基因在每个样本中的突变情况。每一行是一个基因,每一列是一个样本。不同的颜色表示不同的不变类型。具体可以查看左下角的图注。右边的柱形图表示包含该基因突变样本的占比,以及突变类型的组成。

到这里我们瀑布图的绘制就完成了,是不是很简单。后面我们会找一篇SCI文章中的瀑布图来复现。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档