今天一起床收到中国电信发来的短信:5.22是国际生物多样性日。
正好问读者一个问题:生物多样性分为几个层次?
答案在最后~
本文参考《数量生态学》,总结一下排序分析。
排序分析按照不同的模型可以分为两类:
1.基于线性模型所建立的排序方法叫做线性排序(linear ordination),以主分量分析(Principal components analysis,PCA)为主。
PCA后来发展出了主坐标分析(Principal coordinates analysis,PCoA)。PCA只能用欧氏距离,而PCoA可以用各种距离。PCoA是PCA的一般化。
将PCA与环境因子结合起来,又发展出了典范主分量分析(Canonical principal component analysis,CPCA)。PCA 分析的每一步都与环境因子进行回归,再将回归系数结合到下一步排序值的计算之中。
2.基于单峰模型的排序称为非线性排序(nonlinear ordination),以对应分析(Correspondence analysis, CA)为基础而发展而来。非线性排序结果一般优于线性排序结果。
CA分析由于在第二轴会产生马蹄形效应,发展出了降趋势对应分析(Detrended Correspondence Analysis,DCA)来克服这一缺点。DCA效果优于CA。
将CA与多元回归结合,每一步计算结果都与环境因子进行回归,建立了典范对应分析(Canonical Correspondence Analysis, CCA)。但是显然的,CCA也会出现马蹄形效应。因此将CCA与DCA的方法结合,出现了降趋势典范对应分析(Detrended Canonical Correspondence Analysis,DCCA)的新方法。
此外,为了克服PCA和PCoA线性的缺点,还从另一个角度发展出了非线性排序方法:无度量多维标定法(Non—Metric Multi—Dimensional Scaling;NMDS)。PCoA是根据不相似系数的值进行得排序,而NMDS是根据不相似系数大小的顺序进行的排序。
以上方法中的大部分在微生物分析中已经很常见了。
PCA之前介绍过:
R-三种做PCA函数的差异:princomp,prcomp及rda
马蹄形效应也介绍过:
CPCA和DCCA除了各自一篇原始的中文文献之外,似乎再没有文章用过。搜了一下也没找到可用的函数或包。
搜R相关的内容可以在这个网站:
https://rdrr.io/
Search for anything R related
参考:
张金屯 数量生态学
END
一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。
目前能力有限,尚不能创造知识,只是知识的搬运工。