基于划分的聚类方法
----
基于划分的方法 简介 : 基于划分的方法 , 又叫基于距离的方法 , 基于相似度的方法 ;
① 概念 : 给定
n
个数据样本 , 使用划分方法 , 将数据构建成
k...聚合层次聚类 图示 :
① 初始状态 : 最左侧 五个 数据对象 , 每个都是一个聚类 ;
② 第一步 : 分析相似度 , 发现
a , b
相似度很高 , 将
\{a ,b\}
分到一个聚类中...;
③ 第二步 : 分析相似度 , 发现
d, e
相似度很高 , 将
\{d, e\}
分到一个聚类中 ;
④ 第三步 : 分析相似度 , 发现
c
与
d,e
相似度很高 , 将...c
数据放入
\{d, e\}
聚类中 , 组成
\{c,d, e\}
聚类 ;
⑤ 第四步 : 分析相似度 , 此时要求的相似度很低就可以将不同的样本进行聚类 , 将前几步生成的两个聚类 ,...基于距离聚类的缺陷 : 很多的聚类方法 , 都是 基于样本对象之间的距离 ( 相似度 ) 进行的 , 这种方法对于任意形状的分组 , 就无法识别了 , 如下图左侧的聚类模式 ; 这种情况下可以使用基于密度的方法进行聚类操作