算法终止条件 ( 切割点 ) : 用户可以指定聚类操作的算法终止条件 , 即上面图示中的切割点 , 如 :
① 聚类的最低个数 : 聚合层次聚类中 ,
n
个样本 , 开始有
n
个聚类 , 逐步合并..., 当聚类个数达到最大值
max
, 停止聚类算法 ;
③ 聚类样本的最低半径 : 聚类的数据样本范围不能无限扩大 , 指定一个阈值 , 只有将该阈值内的样本放入一组 ; 半径指的是所有对象距离其平均点的距离...两个聚类中两个最近的样本之间的距离就是 聚类间的 最小距离 ;
族间距离 最大距离
----
C_i \,, C_j
族间距离 最大距离 公式 :
d_{max }(C_i , C_j) = max...聚类的中心点 ;
d(m_i, m_j)
表示
m_i
样本 和
m_j
样本 之间的距离 ;
总结 : 两个聚类中的中心点样本之间的距离就是 聚类间的 中心点距离 ;
族间距离 平均距离
-...m)
R
表示聚类半径 ;
n
表示聚类中的 样本 个数 ;
m
代表聚类中心点 ;
d(p_i - m)
表示聚类中第
i
个样本距离中心点的距离 ;
基于层次聚类总结
----
1 .