Journal: Journal of Microbiological Methods
Year: 2017
IF: 1.707
Link: https://www.sciencedirect.com/science/article/pii/S0167701217301562#ac0005
这个杂志主要涉及有关微生物的各种方法上的文章。
文章很简单,想记录一下主要是感觉想法挺好的。
核心是假设样本之间的不相似性距离和测序深度存在一定的关系。然后根据对数函数进行了拟合。
d = a*logD +b
其中D为测序深度,d为样本之间的平均不相似性距离。a和b为参数,由群落结构决定。
理想情况下,当d为0时,即测序深度足够深,可以覆盖整个群落。这时候得到的序列数即为理论上所需要的最大序列数。
然后将MG-RAST数据库上的一批数据及实际环境数据代入到公式中,得到a和b的值,并利用公式估计了最大序列数。
公式的关系如图所示:
d为0,即曲线向右一直延长到和x轴相交的交点。
但是存在的问题也是显而易见的:
1. 作者没有说明理由,直接提出不相似性距离(Bray-Curtis)和测序深度之间为对数相关,这点我没搞明白。
2. 作者用Bray-Curtis计算不相似性距离,同时考虑和发生率和丰度。但是事实上不相似性不可能降为0的。因为实验、测序过程和数据处理都会存在偏差。导致物种及丰度的偏差。两个样本之间总会有差别。
3. 作者用了3个重复,测序深度也不到20,000。因此重复数和测序深度比较低。该公式不一定适合高样本量及深度测序的外推。
点分享
点点赞
点在看
END
一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。
目前能力有限,尚不能创造知识,只是知识的搬运工。