前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >手把手学习TCGA数据库:SNP突变分析第七期

手把手学习TCGA数据库:SNP突变分析第七期

作者头像
百味科研芝士
发布2019-08-12 14:58:47
1.8K0
发布2019-08-12 14:58:47
举报
文章被收录于专栏:百味科研芝士

各位科研芝士的朋友,大家好,前面一讲给大家分享了如何借助maftools工具实现对SNP数据的可视化操作,今天我们继续剖析该包的其他用法。还记得上次我们提到的oncoplot函数吗?该函数可以可视化突变频率最高的基因并进行展示,比如想绘制前20个突变基因呢如下(数据源同上一期):

结果如下:

接着问题来了,如果我们想对指定的基因进行突变频率可视化呢?该怎么操作呢?

这个时候我们需要借助oncoplot的genes参数,比如我们向可视化TTN,IDH2,TET2,NRAS,TP53,SMC3这几个基因,那命令行则如下:

结果如下:

你会发现指定的基因排序是按照突变频率由高到低进行排列,如果你不想改变基因的排列顺序,则可以增加一个参数,如下:

结果如下:

除此之外,我们还可以使用oncostrip函数进行可视化任意基因,如下:

转换和颠换数据可视化

前面在讲解SNP基础的时候,我们讲到转换则是嘌呤变嘌呤或者嘧啶变嘧啶,颠换则是异型碱基的置换,一个嘌呤被另外一个嘧啶替换或一个嘧啶被另外一个嘌呤置换,即嘌呤变嘧啶,或者嘧啶变嘌呤。

那么在maf文件里面这些信息也是可以进行展示的,需要借助titv函数将snp分类为转换和转换,并进行展示。

命令如下:

结果如下:Ti代表转换,Tv代表颠换,我们可以发现Ti是Tv的3倍,一般情况下发生转换和颠换频率是2:1。

看到这,我们好像没把临床数据加载进来,这个时候我们可以将临床数据进行加载进去,还是同样的操作,同样采用内置的急性髓性白血病为例子,读进数据如下:

可以看到我们同样借助read.maf函数进行操作,只不过在clinicalData参数后面赋值了laml.clin而已,这个时候的laml对象则涵盖了maf文件同时还包括了临床数据。这个时候我们在进行绘制瀑布图,如下:

代码语言:javascript
复制
可以看到我们是可视化了两个临床特征,分别为FAB_classification和
代码语言:javascript
复制
Overall_Survival_Status,结果如下:
代码语言:javascript
复制

Ok,今天的教程主要是带大家继续采用maftools对maf文件进行处理,希望大家能到学会如何使用maftools,谢谢大家。

后台回复:“snp”,获取代码

·end·

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档