第 10章K-Means(K-均值)聚类算法
K-Means 算法
聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中....簇个数 K 是用户指定的, 每一个簇通过其质心(centroid), 即簇中所有点的中心来描述.
聚类与分类算法的最大区别在于, 分类的目标类别已知, 而聚类的目标类别是未知的....然后将数据集中的每个点分配到一个簇中, 具体来讲, 就是为每个点找到距其最近的质心, 并将其分配该质心所对应的簇. 这一步完成之后, 每个簇的质心更新为该簇说有点的平均值....K-Means 聚类算法的缺陷
在 kMeans 的函数测试中,可能偶尔会陷入局部最小值(局部最优的结果,但不是全局最优的结果)....,聚类会收敛到全局最小值,而原始的 kMeans() 函数偶尔会陷入局部最小值。