Link:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6160831/?report=classic
Journal: MycoKeys
IF: 2.435
Published: 2018 Sep 11
First author: Sten Anslan
Corresponding author: Sten Anslan, Mohammad Bahram
Department: Braunschweig University of Technology (德国布劳恩斯威格理工大学)
目前引用9次
比较了不同分析平台在两组高通量测序数据集上的性能。结果表明,计算时间、质量控制以及输出结果在很大程度上取决于所使用的平台。
PipeCraft、LotuS和PIPITS在真菌扩增子数据集的性能优于QIIME2和Galaxy,但是没有一个平台能够很好地过滤错误。
结论为每个平台的输出都需要通过分类学信息对OTUs进行手动验证。
两套数据
Illumina MiSeq ITS2,节肢动物基质
Pacific Biosciences (PacBio) Sequel,土壤样本
考察了5个平台
PipeCraft: Flexible open-source toolkit for bioinformatics analysis of custom high-throughput amplicon sequencing data.[Mol Ecol Resour. 2017]
PIPITS: an automated pipeline for analyses of fungal internal transcribed spacer sequences from the Illumina sequencing platform.[Methods Ecol Evol. 2015]
LotuS: an efficient and user-friendly OTU processing pipeline.[Microbiome. 2014]
QIIME2: QIIME allows analysis of high-throughput community sequencing data.[Nat Methods. 2010]
Galaxy: The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update.[Nucleic Acids Res. 2016]
另外还提到了一个平台:
SEED 2: a user-friendly platform for amplicon high-throughput sequencing data analyses.[Bioinformatics.2018]
质控方法
VSEARCH: a versatile open source tool for metagenomics.[PeerJ. 2016]
Trimmomatic: a flexible trimmer for Illumina sequence data.[Bioinformatics. 2014]
DADA2: High-resolution sample inference from Illumina amplicon data.[Nat Methods. 2016]
sdm:属于LotuS
fastx (http://hannonlab.cshl.edu/fastx_toolkit)
PipeCraft, LotuS, PIPITS中有ITSx去掉非真菌序列。
去嵌合体及生成OTU
VSEARCH or USEARCH
采用de-novo single linkage clustering的方法。前文报道过reference-based clustering methods得到的结果与之类似:
Moving beyond de novo clustering in fungal community ecology.[New Phytol. 2017]
a. Illumina;
b PacBio.
去掉singletons
数字为剩余的reads数
NA: indicate not available; NP: not performed.
得到OTU之后,进行了多次进一步的筛选。
先用BLAST比对,去掉不是真菌的物种。
再根据e-value和覆盖度筛选,e-value高于1e-25且覆盖度低于70%的序列也被删除。
每个样本中小于10个reads的OTU也被去掉
之后利用LULU再筛选一次。
此外,还将各自平台质控后的数据pool到了一起,再次得到一个单独的OTU。
对于Illumina,用CD-HIT 97%相似度聚类。
CD-HIT: accelerated for clustering the next-generation sequencing data.[Bioinformatics. 2012]
对于PacBio, 用UPARSE 97%聚类。
数据分析
OTU进行Hellinger转化后进行PERMANOVA。
NMDS去除异常点。
稀释曲线用RTK做
结果
不同平台稀释曲线差异很大。两个数据集内部不同方法都存在显著差异。
a.不同平台得到的每个样本的OTU;
b,再次基础上又经过多步筛选后的每个样本的OTU。数量显著下降,不同平台之间更加趋近。也表明任何平台都不能有效的减少错误的OTU。
作者推荐Illumina数据用PipeCraft, PIPITS or LotuS;
对于PacBio数据,推荐PipeCraft。