机器学习 K-Means算法

01

K-Means算法

在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,主要通过不断地取离种子点最近均值的算法。

如下所示,分为3个簇,如何用K-Means正确聚类呢?

02

K-Means算法实施的前提

K-Means算法实施需要满足两个前提:

根据分布的先验概率,求得K

种子点的选取要cunning,尽量地远一点

03

K-Means算法思路

设置 K 个种子点;

遍历每个点,找到挨着最近的种子点,这就是它所属的簇;

遍历结束后,重新计算K个种子点的位置;

重复 Steps 2 and 3,直到 K个种子点的位置不再改变。

如下两个簇,初始位置:m1, m2,实施K-Means的时候可以看到种子点m1,m2的轨迹移动情况。

算法channel会有系统地,认真地推送:机器学习(包含深度学习,强化学习等)的理论,算法,实践,源码实现。期待您的参与!

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180117G0127Z00?refer=cp_1026

同媒体快讯

相关快讯

扫码关注云+社区