专栏首页小明的数据分析笔记本R语言可视化展示gff3格式基因组注释文件简单小例子

R语言可视化展示gff3格式基因组注释文件简单小例子

参考资料

https://girke.bioinformatics.ucr.edu/GEN242/mydoc_Rgraphics_7.html

这个链接还有好几份其他教程,包括 RNAseq分析流程全基因组重测序变异检测流程 等,大体看了一眼,他的流程全都是在R里面操作的。抽时间重复。

这篇文章记录使用R语言的 ggbio 这个包可视化gff3格式的基因组注释文件

我用到的文件是NCBI下载的拟南芥注释文件,为了减小计算压力,我只用到了gff文件的前119行,两个基因。

首先是读入gff文件

用到的函数是 GenomicFeatures R包中的 **makeTxDbFromGFF()**函数

library(GenomicFeatures)
txdb<-makeTxDbFromGFF(file="practice.gff",format="gff3")
可视化

用到的 ggbio 这个包中的 **autoplot()**这个函数

library(ggbio)
autoplot(txdb,
         which=GRanges("CP002684.1", IRanges(100, 9000)),
         names.expr = "gene_id")+
  theme_bw()

结果

可以通过fill参数设置不同的颜色

autoplot(txdb,
         which=GRanges("CP002684.1", IRanges(100, 9000)),
         names.expr = "gene_id",fill="red")+
  theme_bw()

image.png

不同的基因填充不同的颜色

autoplot(txdb,
         which=GRanges("CP002684.1", IRanges(100, 9000)),
         names.expr = "gene_id",aes(fill=gene_id))+
  theme_bw()

image.png

现在还不知道如何给同一个基因不同的部分(utr,exon,intron)等填充不同的颜色 还有就是 makeTxDbFromGFF() 函数读入的数据存储格式还没搞懂

开头提到的参考资料里有一幅图将 reads数量, 覆盖度的折线图,vcf文件的结果,gff可视化的结果画到了一起,做基因组重测序分析应该会用得到。这里暂时不重复了。等用到的时候再说。

今天就到这里了,抽时间看看下autoplot()这个函数的帮助文档

本文分享自微信公众号 - 小明的数据分析笔记本(gh_0c8895f349d3),作者:Punicagranatum

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-07-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 使用Django框架开发的第一个简易web程序:计算fasta序列长度和GC含量

    本次使用的基础配置 python版本:3.6.3 Django:2.2 Windows10系统 如何查看Django版本

    用户7010445
  • 动植物基因组大小粗略比较

    在知乎看到问题 为什么植物基因组比动物基因组大(为什么植物基因组似乎比脊椎动物拥有更多的基因?)? 印象里好像也不一定,因为拟南芥的基因组也才100多M,自己之...

    用户7010445
  • Magic-BLAST简单介绍

    -in 参考序列 -dbtype 数据类型:核苷酸和蛋白质可选 -parse_seqids 暂时还没搞懂这个参数的意思 -out 数据库的名称

    用户7010445
  • 近400个政企网站感染Coinhive恶意软件,秘密挖掘加密货币

    看起来加密货币的流行并没有停止,黑客依然在继续想方设法的窃取用户的计算能力来挖掘加密货币。

    FB客服
  • 众志成城硬造《流浪地球》,中国电影撞进重工业时代

    在阅读今天的文章之前,强烈推荐大家关注这篇取错标题的文章,《点我可直达-就聊挣钱》。因为错过今天,就错过了最佳机会(最后十几个特惠名额),同样点击下方图片也可到...

    纯洁的微笑
  • 到2021年机器人将使美国就业机会减少6%

    美国市场研究公司Forrester发布的一份报告表示,到2021年机器人将使美国的所有工作机会减少6%,从客户服务代表到卡车和出租车司机的各行各业都将受到影响。...

    人工智能快报
  • 在你的服务器上安装Webmin

    Webmin是目前功能最强大的基于Web的Unix系统管理工具。管理员通过浏览器访问Webmin的各种管理功能并完成相应的管理动作。目前Webmin支持绝大多数...

    爆栈工程师
  • 基础拾遗--【转】df与du不一致情况分析

    df 显示的已使用磁盘占用率比du 统计出来的结果要大很多。原因,主要是由于两者计算结果的方式不同。 一、实验情况 1、创建并删除文件 创建文件前的磁盘容量情况...

    小小科
  • Linux应急响应之工具篇

    当企业被攻击者入侵,系统被挂暗链、内容遭到恶意篡改,服务器出现异常链接、卡顿等情况时,需要进行紧急处理,使系统在最短时间内恢复正常。由于应急处理往往时间紧,所以...

    FB客服
  • 观点 | 深度学习的偏见、局限性及其未来

    选自HYPERPARAMETER SPACE 机器之心编译 参与:黄小天 近日,加州大学圣克鲁兹分校(UCSC)斯图尔特实验室博士后 Pablo Cordero...

    机器之心

扫码关注云+社区

领取腾讯云代金券