前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言实现多序列比对(MSA)可视化

R语言实现多序列比对(MSA)可视化

作者头像
一粒沙
发布2020-02-25 13:26:58
8.4K0
发布2020-02-25 13:26:58
举报
文章被收录于专栏:R语言交流中心
大家应该很熟悉多序列比对的工具,比如Clustal X系列,MEGA等。今天给大家介绍一个在R语言实现多序列比对可视化的R包ggmsa。首先我们看下所需要的包:
代码语言:javascript
复制
BiocManager::install("treeio")
BiocManager::install("Biostrings")
BiocManager::install("ggtree")
install.packages("ggmsa")
install.packages("seqmagick")
install.packages("cowplot")

接下来我们看下其核心函数ggmsa:

其中的参数,我们不做赘述,其实都很明显了我们直接进入实战:

代码语言:javascript
复制
sequences <-system.file("extdata", "sample.fasta", package ="ggmsa")
ggmsa(sequences, 320, 360, color ="Clustal")

其它的颜色我们就不一一试了。接下来我们看下,font=NULL,去掉背景之后的样子:

代码语言:javascript
复制
ggmsa(sequences, 320, 360, font = NULL,color = "Chemistry_AA")

然后,我们看下增加了进化树的综合绘图:

代码语言:javascript
复制
library(Biostrings)
x <- readAAStringSet(sequences)
d <- as.dist(stringDist(x, method ="hamming")/width(x)[1])
library(ape)
tree <- bionj(d)
library(ggtree)
p <- ggtree(tree ) + geom_tiplab()
 
data = tidy_msa(x, 164, 213)
p + geom_facet(geom = geom_msa, data =data,  panel = 'msa', font = NULL, color= "Chemistry_AA") +xlim_tree(1)

最后我们看下和基因logo结合的MSA绘图:

代码语言:javascript
复制
f <- system.file("extdata","LeaderRepeat_All.fa", package = "ggmsa")
s <- readDNAStringSet(f)
strings <- as.character(s)
p1 <- ggmsa(s, font = NULL, color ='Chemistry_NT')
 
library(ggseqlogo)
library(cowplot)
 
p2 <- axis_canvas(p1, axis='x')+geom_logo(strings, 'probability')
pp <- insert_xaxis_grob(p1, p2,position="top", grid::unit(.05, "null"))
ggdraw(pp)

欢迎大家学习交流!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档