首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >三类OTU聚类算法

三类OTU聚类算法

作者头像
Listenlii-生物信息知识分享
发布2020-05-28 16:46:35
1.1K0
发布2020-05-28 16:46:35
举报

本文介绍一下3种OTU聚类算法,这些算法使用不同的规则来确定新序列是添加到现有cluster(OTU)中,还是形成一个新的cluster:

complete linkage, 具体如furthest neighbor

average linkage, 具体如average neighbor 或 UPGMA(非加权组平均法)

single linkage, 具体如nearest neighbor

当使用3% cut-off作为cluster的划分依据时:

complete linkage要求新序列和一个cluster中的其他所有序列不相似度低于3%,这个新序列才能进入这个cluster。

average linkage要求新序列和一个cluster中的其他所有序列不相似度的平均值低于3%,这个新序列能进入这个cluster。

single linkage要求新序列和一个cluster中的其他所有序列不相似度中存在一个低于3%,这个新序列就能进入这个cluster。

显然的,complete linkage标准最严,因此得到的OTU数量一般最多。

以上概念参考:2010年的EM

Link:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2909393/

作者发现complete linkage会使得OTU数量虚高。因此先采用了 2% single-linkage的聚类方法,之后再使用average-linkage聚类,得到的OTU数量更准确。可以减少环境样本中30-60%的OTU,与此同时可以保留稀有物种。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档