Published 7 April 2021
Link: https://msphere.asm.org/content/6/2/e01019-20
前言:
这是一篇Opinion。Shannon我们经常用到,而丰富度和均匀度我们也分别经常使用。但是本文的角度是我们往往容易忽略的:将由丰富度和均匀度组成的Shannon再次拆分为这两个指标并进行可视化。
摘要:
Shannon是一种流行的alpha多样性度量,因为它同时估计了丰富度和均匀度。然而由于它的值取决于这两个参数,理论上有无限个丰富度/均匀度值组合得到相同的Shannon数。
通过对Shannon熵测量的两个分量进行解耦,可以通过在散点图上映射丰富度和均匀度坐标来区分具有相同指数的两个群落。
在这样的图表中,置信椭圆将允许测试样本组之间的显著差异。可以对丰富度和均匀度坐标计算的距离矩阵进行多变量统计检验,如PERMANOVA。
因此,在二维(2D)图上绘制丰富度和均匀度,可以更全面地了解alpha多样性在样本组之间的差异。
Shannon熵定义:
S为总物种数;pi为i物种相对丰度。
这个方程将丰富度和均匀度整合在一起:
对于丰富度,即观测到的物种数量;
对于均匀度,可通过求标准化的中位数均匀度(NME)得到:
NME和Pielou均匀度相似但不同:
Pielou均匀度在0和1之间。它不考虑被测群落的实际物种比例,而是将H表示为实践中从未见过的理论最大值的比值。与Pielou指数不同,NME的分子和分母分别代表了给定生物群落中均匀度的中值和最大值。此外,NME的计算独立于Shannon熵的计算,即NME的计算不需要计算H。
以上就分解了Shannon指数,可以画图了~
例一 群落1和2的Shannon指数相同,但丰富度和均匀度项不同,但它们可以完全区分。
群落3(非常均匀)和群落4(非常不均匀)完全不同,尽管物种丰富度相同的。
例二 CD,Shannon指数差别不大;但是AB丰富度-均匀度图像(椭圆为95%置信区间)可显示差异。且AB与EF规律一致。分解得到的丰富度和均匀度指标可以计算距离,得到PCOA。
例三 依测序技术分组的肠型样本的Alpha多样性。B图Shannon差不多,但是A图差异很大。
例四 不同测序技术的3种肠型样本多样性。
优缺点:
i) 利用丰富度作为一个组成部分。这里描述的Shannon使用丰富度作为其组成部分之一。丰富度已被证明是一个不可靠的alpha多样性指标, 部分原因是影响其值的因素过多,如采样设计、测量方法、测序量等。
Haegeman B, Hamelin J, Moriarty J, Neal P, Dushoff J,Weitz JS. 2013. Robust estimation of microbial diversity in theory and inpractice. ISME J 7:1092–1101. https://doi.org/10.1038/ismej.2013.10.
这里选择物种丰富度作是为了简化方法的表示。一个替代方法是使用Hill数。
(ii)与其他多样性绘图方法的关系。群落可以通过绘制beta多样性距离矩阵排序或比较丰度来区分。然而,beta多样性度量的不是熵,而是两个群落组成之间的距离(或更替)。这与alpha多样性是一个不同的概念。此外,beta多样性通常是排序绘制的(如PCA或NMDS),其轴是不能直接解释的,除了它们如何解释方差。丰富度-均匀度的坐标轴是α多样性指标,能够直观地解释两个数据点之间丰富性和/或均匀度的距离。