中的 噪声样本 和 异常样本 ;
⑥ 样本顺序 : 数据集样本 输入的顺序不应该影响聚类结果 ; 基于层次的聚类 , 不同的样本输入顺序 , 会得到不同的聚类分组结果 ;
⑦ 数据维度 : 可以处理 高维度...聚类 ( Cluster ) 相似度矩阵 :
① 别称 : 相似度矩阵 , 又叫做 相异度矩阵 , 或 , 对象-对象 结构 ;
② 存储内容 : 相似度矩阵存储 数据集样本之间的相似性 , 存储 每两个样本之间..., 两个 对象越相似 , 其值越小 ;
③ 矩阵对角线相似度值 : 对象线的值就是 样本
i
与 其本身进行比较 , 其相似度最小 , 取值
0
;
3 ....单模矩阵 : 相似度矩阵是单模矩阵 , 行 和 列 代表的意义相同 , 都代表数据样本本身 ;
① 行的意义 : 样本的个数 , 第
i
行表示第
i
个样本 ;
② 列的意义 : 样本的个数...矩阵转化 : 聚类算法的输入是 相似度矩阵 ( 单模矩阵 ) , 如果给出的是 数据矩阵 ( 二模矩阵 ) , 需要先将数据矩阵转化为相似度矩阵 ;