首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ArticNetWork流程

ArticNetWork流程

作者头像
生信喵实验柴
发布2022-04-07 17:04:07
发布2022-04-07 17:04:07
6330
举报
文章被收录于专栏:生信喵实验柴生信喵实验柴

背景

ARTIC Network(https://artic.network/),这个项目是由英国惠康基因会(Wellcome Trust)资助,旨在为病毒爆发开发方案,提供实时的流行病学信息。项目组开发了一组针对新型冠状病毒的实验室和生物信息学工作流程。这个工作流程最早适用于非洲埃博拉病毒的测序诊断工作。目前新冠疫情全球大流行,就顺势利用到了新冠病毒的测序研究中。目前这个团队一直都在努力优化这个工作流,包括前面我们介绍到的如何扩增病毒全基因组序列,也是来自这个团队的研究成果。必须感谢这个团队的努力工作,为这次疫情做出科学研究上的贡献。

使用 Artic Network 工作流程可以一步到位,输入数据,直接生成基因组序列。该流程支持illumina 测序,同时也支持纳米孔测序。另外,该流程中还为纳米孔测序提供了一个rampar 程序,可以充分利用纳米孔快速实时测序的特点,动态处理数据。

案例地址:

代码语言:javascript
复制
https://github.com/CDCgov/SARS-CoV-2_Sequencing/tree/master/protocols/BFX-UT_ARTIC_Illumina

一、安装软件

代码语言:javascript
复制
git clone https://github.com/artic-network/artic-ncov2019.git
cd artic-ncov2019/
conda env create -f environment.yml
conda activate artic-ncov2019

二、使用案例

1、创建工作目录

代码语言:javascript
复制
# 创建工作目录
mkdir artic;cd artic;
#激活工作环境
conda activate artic

2、下载数据

代码语言:javascript
复制
# 下载数据
#下载nanopore测序数据
wget https://storage.googleapis.com/nih-sequence-read-archive/run/SRR14800265/SRR14800265   -O SRR14800265.sra
fasterq-dump SRR14800265.sra

3、数据过滤

代码语言:javascript
复制
artic guppyplex --min-length 400 --directory ../artic/ --prefix clean

4、运行流程

默认使用 nanopolish 的模式,nanopolish 需要原始 fast5 文件,如果是从网上下载的 fastq格式文件,可以添加参数--skip-nanopolish 跳过这步,或者选择 medaka 的模式。

代码语言:javascript
复制
# 运行流程
#medaka模式
cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./
artic minion --normalise 200 --threads 12 --scheme-directory primer_schemes/ --read-file clean_.fastq nCoV-2019/V3 out  --medaka --medaka-model r941_min_high_g351

三、实战

学会了以上内容,我们就可以去NCBI找找纳米孔测序的数据练练手了。

接下来我们针对埃博拉病毒跑一下前述流程。

1、下载数据

代码语言:javascript
复制
mkdir ebov;cd ebov;
wget http://artic.s3.climb.ac.uk/run-folders/EBOV_Amplicons_flongle.tar.gz
tar -zxvf EBOV_Amplicons_flongle.tar.gz

拷贝配置文件

代码语言:javascript
复制
cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./

2 、basecalling以及demultiplex

代码语言:javascript
复制
#激活环境
conda activate artic
#basecalling
artic gather --min-length 400 --max-length 800 --prefix ebov-mayinga --directory ./20190830_1509_MN22126_AAQ411_9efc5448 --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass
#拆分barcode
artic demultiplex --threads 2 ebov-mayinga_fastq_pass.fastq

3 、获得基因组

代码语言:javascript
复制
artic minion --normalise 200 --threads 12 --scheme-directory primer-schemes/ --read-file ebov-mayinga_fastq_pass-NB03.fastq --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass --sequencing-summary ./20190830_1509_MN22126_AAQ411_9efc5448/lab-on-an-ssd_20190830_160932_AAQ411_minion_sequencing_run_EBOV_Amplicons_flongle_sequencing_summary.txt IturiEBOV/V1 ebov

那么前面我们就介绍了新冠病毒基因组的拼接,无论是宏基因组测序,未知的,还是说拼接已知的都可以;无论illumina还是纳米孔测序都可以,如果现在给我们一个新冠病毒的测序数据,我们就可以快速的给出基因组序列,有了它我们就可以做其他各种分析了。新冠病毒测序分析的部分,我们就告一段落了。

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。

代码语言:javascript
复制
bioinfoer.com

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信喵实验柴 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档