前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Flye | 三代测序数据组装软件③

Flye | 三代测序数据组装软件③

作者头像
生信real
发布2022-08-18 09:03:23
1.2K0
发布2022-08-18 09:03:23
举报
文章被收录于专栏:Linux基础入门Linux基础入门

Flye软件简介

Flye是针对三代测序数据开发的基因组de novo组装的生信软件。同时也可拼接质粒和宏基因组。

Flye官网

代码语言:javascript
复制
https://github.com/fenderglass/Flye

Flye软件安装

代码语言:javascript
复制
#1、conda安装flye                           
conda install -y flye 
#2、编译安装flye
wget \
https://github.com/fenderglass/Flye/archive/refs/heads/flye.zip
# 解压文件
unzip flye.zip
# 安装软件
cd Flye-flye
make
# 将软件添加到环境变量
vim ~/.bashrc
PATH=/opt/biosoft/GENOME/Flye-flye/bin/:$PATH
source ~/.bashrc

Tips:①如果wget无法下载建议用浏览器下载后自行传入服务器;②将软件添加到bashrc时,需要根据自己软件的安装位置进行添加;添加完成后需要source刷新一下

Flye示例数据下载

代码语言:javascript
复制
# pacbio示例数据下载
wget \
-O pacbio.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494912/SRR8494912 
# nanopore示例数据下载
wget \
-O nanopore.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494939/SRR8494939

Flye示例数据处理(sra转fastq)

代码语言:javascript
复制
# pacbio示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 pacbio.sra
# nanopore示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 nanopore.sra

Tips:fastq-dump会将sra格式转化成fastq格式,同时--gzip参数会对fastq进行压缩,示例pacbio.sra最终会被转化为pacbio.fastq.gz

Flye常用选项参数

代码语言:javascript
复制
--nano-raw :设置 nanopore 原始数据所在路径
--nano-corr :设置纠错后的 nanopore 数据所在路径
--pacbio-raw :设置 pacbio 原始数据所在路径
--pacbio-corr :设置纠错后 pacbio 数据所在路径
--genome-size :预估基因组大小,评估覆盖深度
--threads :线程数
--out-dir :输出结果文件路径

Tips:--pacbio-corr/--nano-raw纠错时间较长,效果甚微,一般建议直接输入原始数据进行拼接

Flye使用案例

代码语言:javascript
复制
flye \
--pacbio-raw pacbio.fastq.gz \
--genome-size 5.4m \
--out-dir pacbio_flye_out

Flye主要结果输出文件

代码语言:javascript
复制
assembly_info.txt # 查看组装结果是否成环
assembly.fasta # 最终组装结果文件,用于下游分析
代码语言:javascript
复制
## 通过cat命令查看assembly_info.txt信息
$ cat assembly_info.txt 
#seq_name length cov. circ. repeat mult. graph_path
contig_1 5314007 182    +     -      1      1
contig_2 107531 249     -     -      1     2,3
contig_4 88570   178    +     -      1      4
contig_5 175726 204     -     -      1     5,3

Tips:assembly_info.txt中circ显示是否成环,"+"表示已经成环,"-"表示未成环

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信百宝箱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Flye软件简介
    • Flye官网
      • Flye软件安装
        • Flye示例数据下载
          • Flye示例数据处理(sra转fastq)
            • Flye常用选项参数
              • Flye使用案例
                • Flye主要结果输出文件
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档