前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >编译|mummer2circos画环状细菌基因组圈图

编译|mummer2circos画环状细菌基因组圈图

作者头像
用户1075469
发布2024-04-12 14:57:14
790
发布2024-04-12 14:57:14
举报
文章被收录于专栏:科技记者科技记者

mummer2circos 是一个用于绘制细菌基因组的圈图(circos 图)的工具。它基于 BLAST 或 NUCMER/PROMER 的比对结果,生成 SVG 和 PNG 格式的图像,可以直观地展示基因组的结构和特征。

安装

方法一: 用 conda

先下载 yaml 文件,发现直接装 conda 直接 conda 装不行,因为依赖于 blast 等,测试环境 windows,在 wsl2 上经过多次尝试,耗费时间很久,能 docker 还是 docker

许久还在转圈。。。

conda install -c bioconda -c conda-forge mummer2circos

方法二:Docker 或类似的 Singularity 等容器方法

代码语言:javascript
复制
# Docker
windows下先根据官方说明安装docker desktop,然后打开,发现登陆账户由于国内网络原因很折腾,直接wsl命令行进行。
sudo docker pull metagenlab/mummer2circos:1.4.2
# Singularity
# 准备镜像
singularity build mummer2circos.simg docker://metagenlab/mummer2circos:1.4.2
# 运行
singularity exec mummer2circos.simg mummer2circos -r <reference.fna> -q <query.fna>  -l

比对方法

  • 全基因组比对可以使用三种不同的方法完成:Megablast、Nucmer 或 Promer
  • 使用参数 -a 指示要使用的方法。Nucmer 是默认选项。 mummer2circos -l -a promer ...

简单图

  • -r 参考 fasta
  • -q 其他 fasta 与参考 fasta 进行比较
  • -l 建造圆形地块的修补选项 基因组轨迹根据输入查询 FASTA 文件的顺序进行排序
代码语言:javascript
复制
sudo docker run --rm -v /home/:/data -it metagenlab/mummer2circos:1.4.2
(base) mambauser@8561c1b8f8de:/data$ mummer2circos -l -r source/mummer2circos/examples/genomes/NZ_CP008827.fna -q source/mummer2circos/examples/genomes/*fna -f
14:07:36 INFO Genomes will be aligned with:     nucmer
14:07:36 INFO Reference genome: source/mummer2circos/examples/genomes/NZ_CP008827.fna
14:07:36 INFO running nucmer: nucmer -b 200 -c 65 -g 90 -l 20 -p circos_tmp/CP006659 source/mummer2circos/examples/genomes/NZ_CP008827.fna source/mummer2circos/examples/genomes/CP006659.fna
...
14:09:08 INFO Query genome 10/10: source/mummer2circos/examples/genomes/NZ_FO834906.fna
14:09:08 INFO Track file list ['CP006659.heat', 'KpFR_13.heat', 'NZ_CP008827.heat', 'NZ_CP008929.heat', 'NZ_CP012426.heat', 'NZ_CP012745.heat', 'NZ_CP014647.heat', 'NZ_CP015822.heat', 'NZ_CP016811.heat', 'NZ_FO834906.heat']
14:09:08 INFO Plotting heatmap type plot...
14:09:27 INFO Circos plot generated sucessfully, see nucmer2circos.svg & nucmer2circos.png
14:09:27 INFO Circos files saved in circos_data:
        - main configuration file:              circos.config
        - Contigs definition:                   circos_contigs.txt
        - GC skew:                              circos_GC_skew.txt
        - GC content:                           circos_GC_content.txt
        - Heatmap track 1:                      CP006659.heat
        - Heatmap track 2:                      KpFR_13.heat
        - Heatmap track 3:                      NZ_CP008827.heat
        - Heatmap track 4:                      NZ_CP008929.heat
        - Heatmap track 5:                      NZ_CP012426.heat
        - Heatmap track 6:                      NZ_CP012745.heat
        - Heatmap track 7:                      NZ_CP014647.heat
        - Heatmap track 8:                      NZ_CP015822.heat
        - Heatmap track 9:                      NZ_CP016811.heat
        - Heatmap track 10:                     NZ_FO834906.heat
14:09:27 INFO The plot can be modified (to change color scales, remove or add tracks...) by modifining the file "circos.config" and excuting the command "circos -conf circos.config"

工作目录下,3 种格式的图片已经生成啦!

  • -c 更紧实的环

加上基因轨

参考 Fasta 文件染色体(和最终质粒)的标题应与 GenBank 文件的位点加入相同。请参阅示例文件 NZ_CP008828.fna。

LOCUS NZ_CP008828 15096 bp DNA CON 16-AUG-2015

代码语言:javascript
复制
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk

标记特定基因

  • 给定感兴趣的蛋白质的 FASTA 文件,在圆形图上标记每个氨基酸序列的 BBH(小编注:BBH (Best Bidirectional Hit) 是一种用于比较蛋白质序列之间相似性的方法)
  • fasta 标头用作标签(请参阅示例文件 VF.faa)
代码语言:javascript
复制
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa

# 显示沿染色体(和质粒)的映射深度

  • 深度文件可以使用SamTools Depth从 BAM 文件生成
  • .depth 文件中使用的标签应与 Fasta 标头相同(请参阅示例文件)
  • 深度大于中位数 2 倍的区域被裁剪到该限制并着色为绿色(处理高度重复的序列)。
  • 深度低于中位深度一半的区域以红色着色。
代码语言:javascript
复制
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth

根据坐标文件添加标签

  • 结构:LOCUS 启动子终止子标签(见 labels.txt)
  • 标签不能包含空格
代码语言:javascript
复制
mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/NZ_FO834906.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt

显示两个基因组之间的联系

代码语言:javascript
复制
mummer2circos -r genomes/NZ_CP012745.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt

One More Thing

如果你有耐心翻到最后的话,P.S.豆豆小编表示软件里的这个脚本 mummer2circos/GC.py 非常实用,计算 GC 和 GC skew 这两个在比较基因组中经常使用,之前使用 bedtools 计算的,非常值得学习!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-03-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 微因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装
    • 方法一: 用 conda
      • 方法二:Docker 或类似的 Singularity 等容器方法
      • 比对方法
      • 简单图
      • 加上基因轨
      • 标记特定基因
      • # 显示沿染色体(和质粒)的映射深度
      • 根据坐标文件添加标签
      • 显示两个基因组之间的联系
      • One More Thing
      相关产品与服务
      容器服务
      腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档