差异丰度分析方法基准测试
差异丰度分析(DAA)是微生物组数据分析中一项中心统计任务,相关微生物组数据的DAA(DAA-C)工具可有效筛选微生物候选物,便于进一步的验证。今年1月,《Briefings in Bioinformatics》发表综述文章,使用基于真实数据的模拟对现有DAA-C工具进行了首次全面评估。
//
DAA的目标是确定其丰度与感兴趣变量相关的微生物特征。纵向微生物组研究的日益普及和多种DAA-C方法的可用性要求进行全面评估,为最终用户和工具开发人员提供建议和指导。与针对独立微生物组数据的 DAA方法的几项基准研究相比,还没有针对相关微生物组数据的DAA-C方法进行基准研究。因此,在这项研究中,研究团队进行了一项大规模模拟研究,以客观地评估现有主要DAA-C方法在各种设置下的性能。
DAA-C方法基准测试
研究团队使用半参数模拟框架对主要现有DAA-C方法的性能进行了基准测试,该框架能够生成具有特定相关性结构的真实微生物组数据。此项研究在三种常见的研究设计下评估DAA-C方法的性能,这些设计包括(i)重复采样,其中每个微生物组样本都要进行多次测量,以减少噪声;(ii)配对设计,在每个受试者治疗前后对微生物组进行采样;(iii)一般纵向采样,即在多个时间点对两组受试者的微生物群落进行采样。研究团队还重点评估DAA-C方法控制误报的能力以及在错误发现率(FDR)控制之后检测真实关联信号的能力。
本研究评价的DAA-C方法
研究结论:
线性模型方法(如LinDA、MaAsLin2和LDM)比基于广义线性模型的方法性能相对更稳健;没有一种评估方法在各种设置中是最佳的,性能最佳的方法主要取决于生物学真相和数据特征;LinDA方法在假阳性控制和功率间有较好的权衡,且是唯一在强成分效应下能有效控制FDR的方法。
DAA-C方法在大便和阴道微生物组数据全局空值设置下的性能(重复采样)
重复采样设计下的假阳性对照和功率(平衡变化设置,A:粪便,B:阴道)
配对采样设计下的假阳性对照和功率(平衡变化设置,A:粪便,B:阴道)
一般纵向设计下的假阳性控制和功率下(平衡变化设置)。A,B:测试组(X)效应[A:粪便,B:阴道]和C,D:测试时间(T)效应[C:粪便,D:阴道]
配对采样设计下的假阳性对照和功率(不平衡变化设置,A:粪便,B:阴道)
一般纵向设计下的假阳性控制和功率下(不平衡变化设置)。A,B:测试组(X)效应[A:粪便,B:阴道]和C,D:测试时间(T)效应[C:粪便,D:阴道]
基于各种评估指标的DAA-C方法的性能总结
基于三个实验数据集的纵向差异丰度分析(DAA-c)方法评估
//
参考文献
Yang L, Chen J. Benchmarking differential abundance analysis methods for correlated microbiome sequencing data[J]. Briefings in Bioinformatics, 2023, 24(1): bbac607.