Online on bioRxiv: Mar 4 2019
Published on mSphere: May 22 2019
IF: 3.575
“
3月刊出在生物学预印本bioRxiv,5月就发表在了mSphere,速度相当之快。
本文研究了5种高保真聚合酶和不同PCR循环数对模拟群落和人类粪便样本微生物群落的影响。结果表明采用最高保真度的聚合酶,并控制PCR的循环数最小化,可以降低测序错误率、嵌合体序列的比例和群落丰度偏差。
对于模拟群落,实测物种丰度和理论值的差异随着PCR循环数增加而增加。但是人类样本不存在这种规律。
人类粪便样本本身之间的差异大于聚合酶及循环数带来的差异。
”
模拟群落(mock community)组成已知,但是系统发育多样性小;自然群落组成未知,系统发育多样性高,但是难以全部绝对定量。因此可以用环境样本进一步评估模拟群落得到的结果,并考察人为因素对生物学和方法学上产生的变异。
8中细菌混合等量基因组DNA构建模拟群落。由于基因组大小及拷贝数的差异,16Sr RNA基因的个数在8种菌中并不相同。
测量16S rRNA基因 V4区。
PCR循环包括20,25,30,35个。
5种酶包括Accuprime, Platinum, Phusion,Q5 和 KAPA。
对于模拟群落,每种酶和循环数的组合做4个技术重复。环境样本不做重复。
用OptiClust 算法在97%相似度水平聚类OTU。这个算法还是第一次见。。。
Westcott SL, Schloss PD. 2017. OptiClust, an improved method for assigning amplicon-based sequence data to operational taxonomic units. mSphere2:e00073-17.
https://doi.org/10.1128/mspheredirect.00073-17.
结果
PCR循环显著影响错误率。数据质控可以消除部分错误率。5种酶之间也有差异。循环数高时KAPA效果最好。用Mothur中的seq.error命令计算错误率。
A.模拟群落PCR循环导致嵌合体比例增加。由于模拟群落组成已知,作者首先生成了模拟群落所有可能的嵌合体类型(Mothur中的seq.error命令计算),并和UCHIME检测的嵌合体进行比较,考察不同酶的特异性和灵敏性。循环数较高时KAPA嵌合体比例最低,灵敏性最高。另外结果还表明嵌合体的形成与酶的种类无关,而是取决于序列本身。
B.人类粪便样本。同样观察到嵌合体比例随PCR循环数不断增加。
模拟群落实际丰度与理论丰度的比较。灰线是理论值。左下角的数字为不同菌中鸟嘌呤或胞嘧啶的百分比。结果表明PCR循环及不同酶并不能增加丰度的偏差。
酶及PCR在群落水平上的影响。
A richness及shannon的影响。循环增加KAPA的shannon竟然会减小。其他四种酶增加。这表明对于其他四种酶,随着循环增加,高丰度的物种还会更多的被PCR出来,即群落的均匀性减小。而对于KAPA则是低丰度物种被不断扩增,群落均匀性增加。
B PCR25循环的群落与30,35循环的群落计算Bray-Curtis距离。
C 不同循环及酶得到的群落做PcoA。按照循环数有明显的区分。但是统计检验表明循环(R2=0.21; P <0.001)和酶(R2= 0.20; P <0.001)有着相近的效应。
环境样本差异大于酶和循环数的差异。
模拟群落(左)技术重复之间差异很小;人类样本(右)由于没有技术重复差异很大。
Accuprime 和Platinum保真度比Taq高越10倍,而Phusion, Q5, 和 KAPA比Taq高100倍以上。
综合全文结果,KAPA错误率和嵌合体比例最低,群落偏差最小。但是KAPA会得到高比例的引物二聚体。因此作者推荐Accuprime酶作为KAPA的替代。
(不清楚作者为啥这样说,原文没有引物二聚体的结果。而且我自己用KAPA并没有发现有二聚体。)
ps:由于之前写过一次国内的文章,指出了其中一个错误,就被原作者找到我了,后面发生了啥都懂的。但是本文作者都是老外,就不得不吐槽一下,本文没有啥创新点。做的内容之前早就有人做了,还发了Nature biotechnology。详见
Gohl DM, Vangay P, Garbe J, MacLean A, Hauge A, Becker A, GouldTJ, Clayton JB, Johnson TJ, Hunter R, Knights D, Beckman KB. 2016. Systematic improvement of amplicon marker gene methods for increased accuracy in microbiome studies. Nat Biotechnol 34:942–949.
https://doi.org/10.1038/nbt.3601