Journal: Microbiome
Publish: 2021
Link:
https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-021-01034-9
接上篇:
Bioinformatics:线性分解模型LDM检验微生物差异
摘要
本文提出了一个新的策略,PERMANOVA和LDM一起用于分析成对/匹配(matched-set)的数据。
建议为每个组包含一个指示变量作为协变量,以约束组内样本之间的比较,并置换每个组内的特征,这可以解释可替换样本的相关性。
PERMANOVA和LDM的灵活性允许测试离散或连续的特征或交互作用,调整组内混杂因素,并充分利用不平衡的数据。
当使用PERMANOVA或LDM分析成对数据时,加入组指示变量和组内置换是一种良好的策略,能够处理微生物组研究中经常出现的复杂数据结构。
背景知识
目前仅有两种方法专门用于分析匹配的微生物组数据;两者都受限于没有任何成对数据内部协变量的配对数据。
1.成对多项式分布,它只适用于样本量大于分类单元数的情况。
2.广义的配对Hotelling检验,它放宽了方法1的限制,但只能提供群落水平的检验。
匹配数据也可视为具有可交换的相关性的纵向数据(longitudinal data with an exchangeable correlation)的特殊情况。因此,一些用于分析纵向数据的方法可以用于分析匹配数据。这些方法分别应用于每个OTU。
一个吸引人的选择是线性混合效应模型(LMM),它通常被应用于arcsin-root-transformed的相对丰度数据,以提高正态性。还开发了一个零膨胀的随机效应β回归模型(ZIBR),专门用于建模(未转换的)相对丰度数据。这两种方法都是基于完全参数化的模型,因此可能不太适合每个OTU。
此外一些策略将现有的微生物组检验扩展到分析匹配组数据,如DESeq2和PERMANOVA。
之前引入了LDM,主要用于分析独立数据。LDM在群落和OTU层面都提供检验。这些检验以统一的方式进行,因此群落级检验的结果可以与OTU级的结果一起实现。PERMANOVA和LDM都是基于回归和置换的,这使得它们很容易扩展匹配数据。尽管在LDM的文章中考虑了组内置换,但那是在感兴趣的变量可能低于组水平的背景下。之前还没有从理论或数学的角度明确考虑在此描述的匹配数据。
方法
看不懂。
使用
R包LDM:https://github.com/yijuanhu/LDM
只能下载到本地之后安装。下篇介绍用法。