纳米孔原始数据质量控制软件-NanoPack的安装

Hello,大家好,上周我们的MinION运行了两天两夜终于顺利完成了第一次nanopore 测序。接下来就到了对原始数据的处理环节。因为nanopore 产生的长序列不同于illumina测序的短序列,所以像FastQC (Babraham Bioinformatics 2010, https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) 这种为illumina测序较短读长及极高准确度的序列量身定做的分析工具不再适用于nanopore 的序列分析。

因此这一周以来我都在寻找并学习针对nanopore测序序列分析处理的软件,其间走了很多弯路,犯了很多错误,也学到很多东西。现在就把这些经验分享给大家,让大家在接触到类似数据、使用类似工具的时候能少走弯路。

本文分为三个部分:

一、NanoPack工具介绍

二、准备条件

三、Ubuntu 操作系统上NanoPack的安装

NanoPack工具介绍

Nanopack(https://www.biorxiv.org/content/early/2017/12/21/237180)与其说是一个软件,不如说是一个软件包,其中包含NanoPlot , NanoComp , NanoQC , NanoStat , NanoFilt , NanoLyse 六个脚本及 nanoget , nanomath , nanoplotter 三个模块。是专门针对nanopore测序产生的原始数据进行处理的软件。

说了这么多,它能进行哪些数据处理呢?不罗嗦,直接上图:

图1:NanoPlot 总体统计

图2:序列读长统计直方图

图3:序列读长的加权直方图

图4:序列读长对数转换对比

以上图片展示的仅是NanoPlot 和 NanoComp 脚本生成的一小部分图片,非常全面的统计结果。

当然还有其他脚本不需要图片来表达,比如NanoFilt 用于设定最小长度,最小质量截止值,最小和最大平均GC值来过滤fastq文件;NanoLyse用于过滤fastq文件的流式脚本,可去测序序列中λ噬菌体基因组(在nanopore测序中使用的control DNA)的序列。

准备条件

1. nanopore测序产生的原始数据,我们使用的是fastq格式文件。

2. 一台Linux 系统电脑,当然使用服务器更好。我们使用的是一台Ubuntu 16.04 系统的台式机。

Ubuntu 操作系统上NanoPack的安装及使用

为方便没有接触过的同学轻松学习,这部分介绍会比较详细,大神请绕道。

1. 获取系统root权限,一个简单的命令:

2. 因为NanoPack 是基于Python3 编写的程序,所以正常运行需要Linux系统配置Python3环境变量,可以下面命令查看自己的系统是否已经安装了Python3:

出现上图所示的信息则表示系统已配置了python3, 否则需要先安装python3(ps:Python2 和Python3 可以在同一系统兼容,安装Python3 无需卸载Python2,Python3的安装也不会覆盖Python2)。如果已经安装好了Python3,请直接跳至第8步。

3.如果没有安装python3, 则首先下载Python3安装包:

4. 等待下载完成,解压文件:

5. 进入解压出的文件夹,添加配置,配置自己的安装目录,即在下图命令中 –prefix= 后更改自己确定的安装目录,不建议直接安装在/usr/bin/,因为这是系统默认的Python2 的安装目录,容易产生混淆:

6. 安装:

7. 建立软链接,再次尝试pythons3 命令:

细心的同学可能会发现,这张图片中的Python 3 就已经更新到3.6.5 的版本,而非第二张图片中的Python 3.5.2 版本,说明我们覆盖安装成功了。

8. 如果已经安装了python3, 我们就直接安装pip模块:

9. 安装setuptools模块:

10. 安装其他各种可能需要的软件:

使用命令:apt-getinstall build-essential autoconf libtool pkg-config python-opengl python-imaging python-pyrex python-pyside.qtopengl idle-python2.7qt4-dev-tools qt4-designer libqtgui4 libqtcore4 libqt4-xml libqt4-test libqt4-script libqt4-network libqt4-dbus python-qt4 python-qt4-gl libgle3 python-dev libssl-dev

11. 安装文献中明确提及的第三方模块:

12. 安装NanoPack:

好了,到这里我们的安装就完成了,可以使用NanoPack包内的各种工具了。

感兴趣的同学遇到问题可以一起交流。

谢谢大家的阅读,祝大家生活愉快、实验顺利!

作者:进化基因组学实验室

2017级动物学硕士研究生 李超

长按下方二维码关注我们

编辑:进化所宣传组

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180425G1R9WX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励