前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >factoextra包 聚类分析(2)

factoextra包 聚类分析(2)

作者头像
用户1359560
发布2018-10-08 10:28:47
1.1K0
发布2018-10-08 10:28:47
举报
文章被收录于专栏:生信小驿站

聚类分析是一种数据贵呀技术,旨在揭露数据集中观测值的子集。它可以把大量的观测值归为若干个类。这里的类被定义为若干个观测值组成的群组,群组内观测值的相似度比群间的相似度高。这不是一个精确的定义,从而导致了各种聚类方法的出现。

最常用的两种聚类方法是层次聚类(hierarchical agglomerative clustering)和划分聚类(partitioning clustering)。在层次聚类中,每一个观测值自成一类,这些类两两合并,直到所有的类被聚成一类为止。在划分聚类中,首先定义指定类的个数K,然后观测值被随机分成K类,再重新形成聚合的类

聚类分析的一般步骤: ⑴选择合适的变量 ⑵缩放数据 ⑶寻找异常点 ⑷计算距离:最常用的距离量度是欧几里得距离 ⑸选择聚类算法 ⑹获得一种或者多种聚类方法 ⑺确定类的数目 ⑻获得最终的聚类解决方案 ⑼结果可视化 ⑽解读类 ⑾验证结果:如果采用不同的聚类方法或者不同的样本是否产生相同的类/fpc,clv和clvalid包含了评估聚类解的稳定性的函数

  • kmeans聚类分析
  • 层次性聚类分析
  • 选择最佳的聚类个数
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.09.30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档