前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >确定群落研究的最小序列数

确定群落研究的最小序列数

作者头像
Listenlii-生物信息知识分享
发布2020-08-28 10:40:22
4100
发布2020-08-28 10:40:22
举报
文章被收录于专栏:Listenlii的生物信息笔记

Journal: Journal of Microbiological Methods

Year: 2017

IF: 1.707

Link: https://www.sciencedirect.com/science/article/pii/S0167701217301562#ac0005

这个杂志主要涉及有关微生物的各种方法上的文章。

文章很简单,想记录一下主要是感觉想法挺好的。

核心是假设样本之间的不相似性距离和测序深度存在一定的关系。然后根据对数函数进行了拟合。

d = a*logD +b

其中D为测序深度,d为样本之间的平均不相似性距离。a和b为参数,由群落结构决定。

理想情况下,当d为0时,即测序深度足够深,可以覆盖整个群落。这时候得到的序列数即为理论上所需要的最大序列数。

然后将MG-RAST数据库上的一批数据及实际环境数据代入到公式中,得到a和b的值,并利用公式估计了最大序列数。

公式的关系如图所示:

d为0,即曲线向右一直延长到和x轴相交的交点。

但是存在的问题也是显而易见的:

1. 作者没有说明理由,直接提出不相似性距离(Bray-Curtis)和测序深度之间为对数相关,这点我没搞明白。

2. 作者用Bray-Curtis计算不相似性距离,同时考虑和发生率和丰度。但是事实上不相似性不可能降为0的。因为实验、测序过程和数据处理都会存在偏差。导致物种及丰度的偏差。两个样本之间总会有差别。

3. 作者用了3个重复,测序深度也不到20,000。因此重复数和测序深度比较低。该公式不一定适合高样本量及深度测序的外推。

点分享

点点赞

点在看

END

一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。

目前能力有限,尚不能创造知识,只是知识的搬运工。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档