三类OTU聚类算法

本文介绍一下3种OTU聚类算法,这些算法使用不同的规则来确定新序列是添加到现有cluster(OTU)中,还是形成一个新的cluster:

complete linkage, 具体如furthest neighbor

average linkage, 具体如average neighbor 或 UPGMA(非加权组平均法)

single linkage, 具体如nearest neighbor

当使用3% cut-off作为cluster的划分依据时:

complete linkage要求新序列和一个cluster中的其他所有序列不相似度低于3%,这个新序列才能进入这个cluster。

average linkage要求新序列和一个cluster中的其他所有序列不相似度的平均值低于3%,这个新序列能进入这个cluster。

single linkage要求新序列和一个cluster中的其他所有序列不相似度中存在一个低于3%,这个新序列就能进入这个cluster。

显然的,complete linkage标准最严,因此得到的OTU数量一般最多。

以上概念参考:2010年的EM

Link:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2909393/

作者发现complete linkage会使得OTU数量虚高。因此先采用了 2% single-linkage的聚类方法,之后再使用average-linkage聚类,得到的OTU数量更准确。可以减少环境样本中30-60%的OTU,与此同时可以保留稀有物种。

本文分享自微信公众号 - Listenlii(gh_1a9e56035563),作者:水岸风堤

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • indicspecies:计算物种与样本之间关系的强度与生态位宽度

    生物信息知识分享
  • Trends in ecology: 40年生态学研究的变化

    Journal: Frontiers in Ecology and the Environment (IF: 8.039)

    生物信息知识分享
  • 什么是好的R包

    我发现写作这个事情也非常遵循楞次定律,上学期一旦开始了越写越停不下来,但是过春节停一段时间后,越不写越难以重新开始。整理了不少东西可以写作,但是每次都被懒癌打败...

    生物信息知识分享
  • 技术贴:一文解锁多比APP使用操作流程

    近日动作频频的DOBI多比交易平台对外宣布启动APP上线计划,旨在帮助日益增长的用户能实现更加简单、便捷、安全的平台交易,避免繁琐操作并规避币价波动带来的风险。

    dobitrade
  • Python | 6大数据类型方法归纳总结(上)

    在Python 3里,只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。

    LogicPanda
  • 字符串方法汇总(三)

    以下为第三期字符串的方法,共10个 16、isspace() 判断字符串是够只包含空格字符,是返回True,否则返回False。 ? 17、istitle()...

    企鹅号小编
  • 使用PowerShell简化我的工作

    在这几年的编程学习和工作中,我积累的许多轻量级的小工具,比如Everything,BeyondCompare,BatchRename、HperSnap等等,这些...

    用户1221057
  • python 3.7 识别图片

    2.安装配套环境 2.1 首先安装OCR字符识别库Tesseract 下载网址:https://digi.bib.uni-mannheim.de/tess...

    py3study
  • 后端大量数据导出场景的思考

    统计类报表除了提供界面查询还提供导出的功能,一般量也不是很大,不容易遇到瓶颈。日志明细类的,比如一个全民APP的下载数据,可能一天的量就是百万级别的。在这种场景...

    李鸿坤
  • Python笔记(九):字符串操作

    (一)    字符串 单引号、双引号、三重引号都可以作为字符串的开始和结束,三重引号可以直接输入多行字符串。三重引号可能一般是用来写多行注释。 ? (二)   ...

    free赖权华

扫码关注云+社区

领取腾讯云代金券