前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用SPAdes测序数据拼接软件拼装基因组

使用SPAdes测序数据拼接软件拼装基因组

作者头像
kongxx
发布2019-03-20 14:31:15
1.9K0
发布2019-03-20 14:31:15
举报

简介

SPAdes 是由俄罗斯科学院 St. Petersburg Academic University 与美国科学家合作开发的主要应用于小型基因组如细菌,真菌等基因组测序数据的拼接软件。目前的最新版本 v3.6.2 可以支持常见的 illumina miseq/hiseq 和 ion torrent 测序数据,对单分子测序平台的 pacbio 和 nanopore 的测序数据也能进行拼装,还能进行混合数据的拼装。在 GAGE-B 的测拼里,在 Miseq 平台上的结果获得了最好的评价。

准备

下载测试数据

代码语言:javascript
复制
curl -O ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/ERR/ERR571/ERR571271/ERR571271.sra

将 sra 文件转换成 fastq 文件

为了将sra文件转换成fastq格式,我们需要使用 fastq-dump 工具,这个工具被打包在 sratoolkit 工具包中。

sratoolkit 工具包下载地址

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

Linux环境可以执行选择下面地址直接下载并解压安装

代码语言:javascript
复制
# CentOS
wget -c https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz
# Ubuntu
wget -c https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz

tar zxvf sratoolkit.2.9.2-centos_linux64.tar.gz

将 sra 文件转换成 fastq 文件

代码语言:javascript
复制
./sratoolkit.2.9.2-centos_linux64/bin/fastq-dump --split-files ERR571271.sra

解压后产生 ERR571271_1.fastq 和 ERR571271_2.fastq 文件。

下载 Docker 镜像

为了测试方便,这里没有从源码进行编译,而是直接使用的 Docker 容器来做测试。

为了从 quay.io 获取 spades 镜像,需要先注册一个账号,注册比较简单,就是填个表格就行了。

代码语言:javascript
复制
sudo docker login quay.io

sudo docker pull quay.io/quay.io/biocontainers/spades:3.12.0--1

运行 Docker 容器

在上面下载的数据文件同级目录下运行下面命令来启动一个容器,且后续的测试命令都需要在此容器里运行。

代码语言:javascript
复制
# 启动一个容器
sudo docker run -it --rm -v `pwd`:/spades quay.io/biocontainers/spades:3.12.0--1 bash

# 运行一下测试
spades.py --test

拼装基因组

代码语言:javascript
复制
# 在容器中运行
cd /spades
spades.py -m 32 -t 16 -1 ERR571271_1.fastq -2 ERR571271_2.fastq -o output

其中可以根据机器配置情况使用 -m 来调节内存,使用 -t 调节线程数。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.03.19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 准备
    • 下载测试数据
      • 将 sra 文件转换成 fastq 文件
        • 下载 Docker 镜像
          • 运行 Docker 容器
          • 拼装基因组
          相关产品与服务
          容器镜像服务
          容器镜像服务(Tencent Container Registry,TCR)为您提供安全独享、高性能的容器镜像托管分发服务。您可同时在全球多个地域创建独享实例,以实现容器镜像的就近拉取,降低拉取时间,节约带宽成本。TCR 提供细颗粒度的权限管理及访问控制,保障您的数据安全。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档