前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原来可以用R这么画基因结构图

原来可以用R这么画基因结构图

作者头像
阿凡亮
发布2020-04-13 13:36:01
2.7K0
发布2020-04-13 13:36:01
举报
文章被收录于专栏:生物信息学生物信息学

gggenes 是一款基于ggplot2开发的R包,可以很方便的画出下图所示的基因结构图。

1. 安装R包

直接从CRAN官方源来安装:

代码语言:javascript
复制
install.packages("gggenes")

或者从github下载安装:

代码语言:javascript
复制
devtools::install_github("wilkox/gggenes")

2. 准备输入数据

官方给的例子如下:

代码语言:javascript
复制
> head(example_genes)  molecule gene  start    end  strand direction1  Genome5 genA 405113 407035 forward         12  Genome5 genB 407035 407916 forward         13  Genome5 genC 407927 408394 forward         14  Genome5 genD 408387 408737 reverse        -15  Genome5 genE 408751 409830 forward         16  Genome5 genF 409836 410315 forward         1

输入数据应该包含6列,分别代表:

物种名 基因名 起始位置 结束位置 基因方向 基因方向

如果不需要考虑画出基因方向的话,只需要前4列数据就行:物种名,基因名,起始位置,结束位置

如果加上基因方向,就需要加上 strand 这一列,正负链分用“forward”和“reverse”表示。示例数据中的 direction 这一列是多余的,并不会被用到。

2. 作图

代码语言:javascript
复制
library(ggplot2)library(gggenes)
ggplot(example_genes, aes(xmin = start, xmax = end,   y = molecule, fill = gene)) +  geom_gene_arrow() +  facet_wrap(~ molecule, scales = "free", ncol = 1) +  scale_fill_brewer(palette = "Set3") +  theme_genes()

图如下:

可以看出来,使用的是我们熟悉的ggplot2语法,再加上 geom_gene_arrow() 函数来实现了基因结构的作图。

下面的我们加上方向,也加上基因名称,代码如下:

代码语言:javascript
复制
ggplot(example_genes, aes(xmin = start, xmax = end,     y = molecule, fill = gene, label = gene, forward = direction)) +    geom_gene_arrow() +    facet_wrap(~ molecule, scales = "free", ncol = 1) +    scale_fill_brewer(palette = "Set3") +    theme_genes() +    geom_gene_label(align = "left")

label = gene, forward = direction 指定了基因名和基因方向

geom_gene_label(align = "left") 在图上添加了基因名并靠左对齐

3. 其他用法

gggenes也可以如上图所示展现基因结构域特征或者比对信息,可以使用geom_subgene_arrow() 函数来实现,需要额外用到另一份数据example_subgenes,代码如下:

代码语言:javascript
复制
> head(example_subgenes)  molecule gene  start    end  strand subgene   from     to1  Genome5 genA 405113 407035 forward  genA-1 405774 4065382  Genome5 genB 407035 407916 forward  genB-1 407458 4078973  Genome5 genC 407927 408394 forward  genC-1 407942 4081584  Genome5 genC 407927 408394 forward  genC-2 408186 4082095  Genome5 genC 407927 408394 forward  genC-3 408233 408257

代码语言:javascript
复制
ggplot(example_genes, aes(xmin = start, xmax = end, y = molecule)) +  facet_wrap(~ molecule, scales = "free", ncol = 1) +  geom_gene_arrow(fill = "white") +  geom_subgene_arrow(data = example_subgenes,    aes(xmin = start, xmax = end, y = molecule, fill = gene,        xsubmin = from, xsubmax = to), color="black", alpha=.7) +  theme_genes()

Note:

github地址: https://github.com/wilkox/gggenes

官方文档地址:https://wilkox.org/gggenes/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生物信息学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档