前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MycoKeys:不同分析平台带来的ITS测序结果的差异

MycoKeys:不同分析平台带来的ITS测序结果的差异

作者头像
Listenlii-生物信息知识分享
发布2020-06-01 13:41:50
1.2K0
发布2020-06-01 13:41:50
举报
文章被收录于专栏:Listenlii的生物信息笔记

Link:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6160831/?report=classic

Journal: MycoKeys

IF: 2.435

Published: 2018 Sep 11

First author: Sten Anslan

Corresponding author: Sten Anslan, Mohammad Bahram

Department: Braunschweig University of Technology (德国布劳恩斯威格理工大学)

目前引用9次

比较了不同分析平台在两组高通量测序数据集上的性能。结果表明,计算时间、质量控制以及输出结果在很大程度上取决于所使用的平台。

PipeCraft、LotuS和PIPITS在真菌扩增子数据集的性能优于QIIME2和Galaxy,但是没有一个平台能够很好地过滤错误。

结论为每个平台的输出都需要通过分类学信息对OTUs进行手动验证。

两套数据

Illumina MiSeq ITS2,节肢动物基质

Pacific Biosciences (PacBio) Sequel,土壤样本

考察了5个平台

PipeCraft: Flexible open-source toolkit for bioinformatics analysis of custom high-throughput amplicon sequencing data.[Mol Ecol Resour. 2017]

PIPITS: an automated pipeline for analyses of fungal internal transcribed spacer sequences from the Illumina sequencing platform.[Methods Ecol Evol. 2015]

LotuS: an efficient and user-friendly OTU processing pipeline.[Microbiome. 2014]

QIIME2: QIIME allows analysis of high-throughput community sequencing data.[Nat Methods. 2010]

Galaxy: The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update.[Nucleic Acids Res. 2016]

另外还提到了一个平台:

SEED 2: a user-friendly platform for amplicon high-throughput sequencing data analyses.[Bioinformatics.2018]

质控方法

VSEARCH: a versatile open source tool for metagenomics.[PeerJ. 2016]

Trimmomatic: a flexible trimmer for Illumina sequence data.[Bioinformatics. 2014]

DADA2: High-resolution sample inference from Illumina amplicon data.[Nat Methods. 2016]

sdm:属于LotuS

fastx (http://hannonlab.cshl.edu/fastx_toolkit)

PipeCraft, LotuS, PIPITS中有ITSx去掉非真菌序列。

去嵌合体及生成OTU

VSEARCH or USEARCH

采用de-novo single linkage clustering的方法。前文报道过reference-based clustering methods得到的结果与之类似:

Moving beyond de novo clustering in fungal community ecology.[New Phytol. 2017]

a. Illumina;

b PacBio.

去掉singletons

数字为剩余的reads数

NA: indicate not available; NP: not performed.

得到OTU之后,进行了多次进一步的筛选。

先用BLAST比对,去掉不是真菌的物种。

再根据e-value和覆盖度筛选,e-value高于1e-25且覆盖度低于70%的序列也被删除。

每个样本中小于10个reads的OTU也被去掉

之后利用LULU再筛选一次。

此外,还将各自平台质控后的数据pool到了一起,再次得到一个单独的OTU。

对于Illumina,用CD-HIT 97%相似度聚类。

CD-HIT: accelerated for clustering the next-generation sequencing data.[Bioinformatics. 2012]

对于PacBio, 用UPARSE 97%聚类。

数据分析

OTU进行Hellinger转化后进行PERMANOVA。

NMDS去除异常点。

稀释曲线用RTK做

结果

不同平台稀释曲线差异很大。两个数据集内部不同方法都存在显著差异。

a.不同平台得到的每个样本的OTU;

b,再次基础上又经过多步筛选后的每个样本的OTU。数量显著下降,不同平台之间更加趋近。也表明任何平台都不能有效的减少错误的OTU。

作者推荐Illumina数据用PipeCraft, PIPITS or LotuS;

对于PacBio数据,推荐PipeCraft。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档