前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Microbiome: 再论扩增子功能预测分析(Picrust)的效果

Microbiome: 再论扩增子功能预测分析(Picrust)的效果

作者头像
Listenlii-生物信息知识分享
发布2020-06-16 15:40:27
1.1K0
发布2020-06-16 15:40:27
举报

Picrust作为扩增子测序功能预测的工具已经被广泛使用了。但是它会与真实情况存在较大的偏差,详见前文对Picrust局限性的介绍:

PICRUSt不灵啦?别慌,它一直都不咋灵~

此文中我推断预测的准确性和测序深度有很强的关系。

Picrust2在Picrust基础上扩大了数据库,增加了预测的准确性。宏基因组公众号之前已经介绍过:

PICRUSt2:OTU/ASV等16S序列随意预测宏基因组,参考数据库增大10倍

最近一篇Microbiome重新评估了Picrust,Picrust2和Fax4Fun的效果。巧了,微生态公众号写了介绍,正好省的我写了:

科研 | Microbiome:微生物群落功能预测的准确性与样本类型和功能类别的关系

结论是再次表明了针对环境样本使用时会产生较大的误差,用于人效果会好一些。

这又让我想到不同环境本身的物种池是否也对功能预测产生影响。

来了来了,又要开始瞎猜了~~~~

在此引用之前PNAS的数据:

PNAS(2016)-尺度定律预测全球微生物多样性

人类肠道中的微生物数量大约在106左右,远远低于全球土壤中微生物的数量。两者物种池的差异造成了功能池的差异。本身人体微生物多样性低,功能多样性正常来说也比全球土壤微生物低,因此预测正确的几率更大。

除了人和土壤,Microbiome的结果还包括了猩猩,鼠,鸡的微生物。这些样本的准确性与土壤差不多。我查到2014年一篇PNAS证明了人类肠道微生物多样性要比猩猩的低很多,而多样性的降低在美国人身上非常明显:与黑猩猩、倭黑猩猩或大猩猩相比,美国人在2万条序列的测序深度上平均少了30个细菌属。

Andrew H, et al. PNAS, Nov 2014, 111 (46) 16431-16435; DOI:10.1073/pnas.1419136111

原文图3 功能预测结果和宏基因组之间的相关性

随便搜了下没找到鸡的和鼠的信息。但是鸡、鼠、猩猩这些动物在自然生存状态下很容易和土壤中的物种池发生联系。即使他们本身的微生物多样性可能不高,但是这种更为“开放”的系统会给微生物群体带来更大的动态波动,预测会更难。

以上一顿分析猛如虎,一看数据我愣住:

专门查了下这篇Microbiome中这些扩增子和宏基因组测序深度,都是别人的数据,此文章汇总进行了功能预测分析。但是,我又刨根问底的看了每一个研究对象的原始文献。

,16S 每个样本只保留1000条序列,宏基因组每个样本1000多万条序列。

,16S 每个样本9000多序列,宏基因组每个样本有5000万条序列。

猩猩,16S每个样本1000条序列,宏基因组每个样本有2700万条序列。

,其中一批数据16S每个样本180万条序列(这个应该是是每个样本原始序列,不是生成OTU之后保留的序列。保留的序列数没看到),宏基因组每个样本有15万多条序列。另一批数据正文里也没有呈现。可能在补充材料里藏得很深没注意。

从数据就能大致看出来,动物的16S数据那么少,宏基因组却那么多,这么点16S做预测跟宏基因组相关,没关系才是正常的吧,有关系我倒是觉得奇怪了。

而人的数据宏基因组序列跟前面比少得多,16S却同时多很多。预测的更准确也是理所应当。

所以本文的结论我非常怀疑。同时也再次印证了测序深度的影响。

总结:

1.功能预测用于环境样本,以及用于比较不同处理之间差异的时候,要非常非常小心。

2.对于文章的结果正确与否,或者说相不相信,还得仔细看他的方法及方法的适用性,不能迷信发表了的文章。像这类文章,发在了Microbiome上,肯定很多人不会仔细看他的方法,只看结论就引用在自己文章或者根据他人结论选择自己的分析方法。但是这可能会带来一些不好的后果。

3.时隔很久又对一篇文章进行了负面的评价。几年前刚建公众号不久,我介绍过一篇EST,材料方法中有一个很小的描述性错误我指了出来。作者是中国人,但是我没想到作者因为这找到了我。最后我道歉,把文章删了。从那以后再写中国人的文章的时候,我会比较小心,遇到错误我直接就忽略了,我害怕指出来之后又触碰到作者的神经,人家又气势汹汹的找上门来了。如果这次作者再找到我,也不知会怎么样。哎,言尽于此吧。

END

一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。

目前能力有限,尚不能创造知识,只是知识的搬运工。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档