前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Canu | 三代测序数据组装软件②

Canu | 三代测序数据组装软件②

作者头像
生信real
发布2022-08-18 09:03:05
1.5K0
发布2022-08-18 09:03:05
举报
文章被收录于专栏:Linux基础入门Linux基础入门

Canu软件简介

Canu软件是Celera Assembler基因组组装软件的一个分支,能利用测序错误率较高的三代测序数据(PacBio或Nanopore)进行基因组De novo组装。该软件的命令行运行方法非常简单,运行速度较快且比较稳定,并能得到较好的基因组组装结果。

Canu软件的运行分四个步骤:(1)首先,调用MHAP软件对错误率较高的三代测序raw reads进行比对,找序列之间的重叠;(2)然后,通过一致性分析方法对reads进行校正;(3)对reads两端覆盖度较低无法校正的碱基进行截短,对reads内部无法校正的碱基位点进行打断;(4)使用OLC算法进行基因组组装。

Canu官网

代码语言:javascript
复制
https://github.com/marbl/canu

Canu软件安装

代码语言:javascript
复制
#1、利用conda安装canu
conda install -y canu
#2、编译安装canu
wget \
https://github.com/marbl/canu/archive/refs/heads/master.zip
# 解压文件
unzip master.zip
# 安装软件
cd canu-master/src
make -j
# 将软件添加到环境变量(根据自己的安装路径进行添加)
vim ~/.bashrc
PATH=/opt/biosoft/GENOME/canu-2.0/Linux-amd64/bin/:$PATH
source ~/.bashrc

Tips:①如果wget无法下载建议用浏览器下载后自行传入服务器;②将软件添加到bashrc时,需要根据自己软件的安装位置进行添加;添加完成后需要source刷新一下

Canu示例数据下载

代码语言:javascript
复制
# pacbio示例数据下载
wget \
-O pacbio.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494912/SRR8494912 
# nanopore示例数据下载
wget \
-O nanopore.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494939/SRR8494939

Canu示例数据处理(sra转fastq)

代码语言:javascript
复制
# pacbio示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 pacbio.sra
# nanopore示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 nanopore.sra

Tips:fastq-dump会将sra格式转化成fastq格式,同时--gzip参数会对fastq进行压缩,示例pacbio.sra最终会被转化为pacbio.fastq.gz

Canu常用普通参数

代码语言:javascript
复制
-s : 输入一个参数配置文件,该文件包含很多其他参数,参数都是以Tag=value形式写入到该配置文件中,具体内容请自行查看软件帮助文档。
-p : 设置输出文件前缀,此参数是必须的;
-d : 设置输出文件路径;
-pacbio-raw : 设置原始pacbio测序数据路径;
-pacbio-corrected : 设置修正后的pacbio测序数据路径;
-nanopore-raw :设置原始nanopore测序数据路径;
-nanopore-corrected :设置修正后的nanopore测序数据路径;
genomeSize : 设置预估的基因组大小,这用于让Canu估计测序深度;
maxThreads : 设置运行的最大线程数。

Canu使用案例

代码语言:javascript
复制
canu \
-d pacbio_canu_out \
-p pacbio_canu \
genomeSize=5.4m \
maxThreads=12 \
-pacbio-raw pacbio.fastq.gz

Canu主要结果输出文件

代码语言:javascript
复制
# 最终拼接结果文件,用于下游分析
pacbio_canu.contigs.fasta
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信百宝箱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Canu软件简介
    • Canu官网
      • Canu软件安装
        • Canu示例数据下载
          • Canu示例数据处理(sra转fastq)
            • Canu常用普通参数
              • Canu使用案例
                • Canu主要结果输出文件
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档