)
① 没有类标签 : 虽然将数据集分成若干子集 , 但是以什么依据分 , 事先是不知道的 ;
② 没有训练集 : 分类操作中 , 将数据集先分成训练集 和 测试集 , 但是在聚类中 , 只有一个数据集...聚类 ( Cluster ) 应用方向 :
① 分析 数据分布 : 如数据集样本分布在空间中 , 可以先对这个数据集进行聚类分析 , 将分在一组的数据当做一个数据 , 相当于数据压缩 ;
② 分类 前预处理...聚类应用实例 :
① 客户管理 : 将不同的客户数据集进行分组 , 分析不同分组的客户的购买模式 ;
② 城市规划 : 将城市中的房子放在一个数据集中 , 总和考虑 房子 价值 , 类型 , 用途 ,...高质量 聚类 要求 :
① 同一分组 : 相同分组中的数据样本 , 高度相似 ;
② 不同分组 : 不同分组中的数据样本 , 高度不相似 ;
3 ...., 聚类分析的质量越高 ; 如有的高质量的聚类方法 , 可以将奇形怪状的聚类模式找出来 ( 下图左侧的聚类分组 ) , 有些低质量聚类分析只能分析出球状的样本分组结构 ( 下图右侧的聚类分组 ) ;