因为聚类分析中没有类别这个概念 ;
4 ....距离函数 : 不同的数据集样本类型 , 其距离函数选择也是不同的 ;
① 标度型函数 : 有刻度的数据 , 如温度 , 距离 , 重量 等 ;
② 布尔型函数 : 适合二元类型数据 , 如 对错 , 男女..., 有无 等值 ;
③ 分类类型 : 离散型的 分类 , 取值大于 2 个 , 如颜色值 等 ;
④ 顺序等级 : 有顺序的取值 , 如班级的名次 , 比赛时的金银铜等级 等 ;
⑤ 向量变量 ;
不同数据类型的相似度计算是不同的...数据矩阵 : 数据集样本通常是以 数据矩阵 的形式给出 , 该矩阵又称为 对象属性结构 ;
① 矩阵行 : 每一行代表了一个样本的输入数据 ;
② 矩阵列 : 每一列代表了样本的某个属性的值 ;
③ 矩阵示例...的 相似度值 ;
③ 存储形式 : 假设有
n
个样本 , 使用
n \times n
维矩阵表示 样本间的相似性 ; 行 和 列 表示的都是所有的样本 , 如
i
行
j
列表示第