首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >微生物研究中的“双零问题”

微生物研究中的“双零问题”

作者头像
Listenlii-生物信息知识分享
发布2020-06-01 12:08:48
发布2020-06-01 12:08:48
1.6K0
举报

上文《微生物网络构建原理: SparCC, MENA, LSA, CoNet》提到了微生物数据由于存在双零问题,会使得相关性偏高。

《数量生态学》中有一小节专门介绍了双零效应:

0的存在其原因有很多:

可能这个地方不适合该物种生存;

可能适合生存,但物种还没有在这里定殖;

可能可以生存,但是存在一定生存压力;

可能该物种存在,但是分布不均匀,取样没有取到;

也可能在后续实验、数据处理阶段丢掉了该物种。

因此双零存在的原因可能不同,简单因为双零就得出物种组成相似是不准确的。

很多方法都需要考虑双零问题带来的效应,如网络。

另外PCA就默认双零是相似的。因此极端情况就会出现马蹄形效应(horseshoe effect),即本来距离最远的样本由于强梯度的存在,在空间中弯曲而离的很近。

因此如果数据位于生态梯度的两端,存在很多双零,这种现象就会很严重。

数据的Hellinger转化或弦(chord)转化可以部分解决这个问题。

typical horseshoe shape

2017年有文章专门讨论了微生物研究中的马蹄形效应,还是Rob Knight大神的作品:

这里不再赘述。

Reference:

Numerical Ecology with R

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档