前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >wtdbg2 | 三代测序数据组装软件①

wtdbg2 | 三代测序数据组装软件①

作者头像
生信real
发布2022-08-18 09:02:47
1.2K0
发布2022-08-18 09:02:47
举报
文章被收录于专栏:Linux基础入门Linux基础入门

wtdbg2软件介绍

wtdbg2能利用Pacbio或Nanopore测序数据进行基因组组装。在组装过程中,软件将reads打断成长度为1024 bp的片段(类似kmer序列),再将相似的片段进行整合成一条vertex序列,然后基于vertex序列在reads上的位置,对vertexs序列进行连接,从而得到基因组序列。这种基因组组装方法和De Bruijin Graph方式类似,但是其kmer序列较长,且允许序列之间有mismatch和gap,被作者称为Fuzzy Bruijn Graph。

wtdbg2相比于Canu等软件,其运行速度可能快了10倍左右。软件在基因组组装前没有对long reads进行校正,在组装后能利用三代和二代测序数据对基因组序列进行校正。

wtdbg2官网

代码语言:javascript
复制
https://github.com/ruanjue/wtdbg2

wtdbg2软件安装

代码语言:javascript
复制
#编译安装wtdbg2
wget \
https://github.com/ruanjue/wtdbg2/archive/refs/heads/master.zip
#解压文件
unzip master.zip
#安装软件
cd wtdbg2-master
make
#将软件添加到环境变量(根据自己的安装路径进行添加)
vim ~/.bashrc
PATH=/opt/biosoft/GENOME/wtdbg2-master:$PATH
source ~/.bashrc

Tips:①如果wget无法下载建议用浏览器下载后自行传入服务器;②将软件添加到bashrc时,需要根据自己软件的安装位置进行添加;添加完成后需要source刷新一下

wtdbg2示例数据下载

代码语言:javascript
复制
#pacbio示例数据下载
wget \
-O pacbio.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494912/SRR8494912  
#nanopore示例数据下载
wget \
-O nanopore.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494939/SRR8494939

wtdbg2示例数据处理(sra转fastq)

代码语言:javascript
复制
#pacbio示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 pacbio.sra
#nanopore示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 nanopore.sra

Tips:fastq-dump会将sra格式转化成fastq格式,同时--gzip参数会对fastq进行压缩,示例pacbio.sra最终会被转化为pacbio.fastq.gz

wtdbg2常用选项参数

代码语言:javascript
复制
-i : 输入fasta格式的reads数据,若输入文件有多个,则多次使用该参数;
-o : 设置输出文件前缀;
-t : 设置线程数;
-f : 强制覆盖已存在的输出文件;
-x : 选择预设参数;
-g : 设置基因组大小,可以带有k/m/g等单位;
-X :从输入的测序数据中选择最长的测序深度达到此设定值的reads数据用于基因组组装,默认值50.0;
-L :过滤掉长度低于此值的reads数据,默认值为0,对于正常的Pacbio数据,建议设置为5000

Tips:-x预设参数选择:"rs" for PacBio RSII, "sq" for PacBio Sequel, "ccs" for PacBio CCS reads and "ont" for Oxford Nanopore);

wtdbg2使用案例

代码语言:javascript
复制
wtdbg2.pl \
-i pacbio.fastq.gz \
-t 12 \
-x rs \
-g 5.4m \
-o pacbio_wtdbg2/pacbio_wtdbg2

wtdbg2主要输出结果文件

代码语言:javascript
复制
#最终组装结果文件,用于下游分析
pacbio_wtdbg2.cns.fa
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信百宝箱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • wtdbg2软件介绍
    • wtdbg2官网
      • wtdbg2软件安装
        • wtdbg2示例数据下载
          • wtdbg2示例数据处理(sra转fastq)
            • wtdbg2常用选项参数
              • wtdbg2使用案例
                • wtdbg2主要输出结果文件
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档