机器学习|K-Means算法

01

K-Means算法

在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,主要通过不断地取离种子点最近均值的算法。

如下所示,分为3个簇,如何用K-Means正确聚类呢?

02

K-Means算法实施的前提

K-Means算法实施需要满足两个前提:

  1. 根据分布的先验概率,求得K
  2. 种子点的选取要cunning,尽量地远一点

03

K-Means算法思路

  1. 设置 K 个种子点;
  2. 遍历每个点,找到挨着最近的种子点,这就是它所属的簇;
  3. 遍历结束后,重新计算K个种子点的位置;
  4. 重复 Steps 2 and 3,直到 K个种子点的位置不再改变。

如下两个簇,初始位置:m1, m2,实施K-Means的时候可以看到种子点m1,m2的轨迹移动情况。

更多聚类算法请参考之前的推送:

机器学习高斯混合模型:聚类原理分析(前篇)

机器学习高斯混合模型(中篇):聚类求解

机器学习高斯混合模型(后篇):GMM求解完整代码实现

高斯混合模型:不掉包实现多维数据聚类分析

原文发布于微信公众号 - 算法channel(alg-channel)

原文发表时间:2018-01-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Python小屋

详解Python使用模拟退火算法求解列表“最大值”

之前发过一个使用爬山算法的文章,请参考:Python使用爬山算法寻找序列“最大值” 模拟退火算法可以看作是爬山算法的一种改进,如果前方有更优解就前进,如果没有...

47060
来自专栏编程之旅

牛顿迭代法与二分法计算平方根

因为不是科班出身,所以即使编程一段时间也时常感觉自身基础知识非常不扎实,于是在最近开始补习算法和计算机理论的基础知识。

22520
来自专栏AI2ML人工智能to机器学习

易图秒懂の深度学习诞生 问题篇

认知科学改写了一帮搞物理的人在做神经网络的局面(参考 ”易图秒懂の连接主义诞生“), 从此以心理学大师Estes的学生,Rumelhart为代表的连接主义的早...

9710
来自专栏机器学习算法与Python学习

干货 | 自然语言处理(2)之浅谈向量化与Hash-Trick

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 ? 这一系列公开课将由一线技术专家从...

36740
来自专栏AI2ML人工智能to机器学习

变分の美

变分法(Variational method)已经成为微积分后主流的分析工具, 在物理和应用数学有着极大的功能。 变分法的诞生起源于最强大的数学家家族两个兄弟之...

12510
来自专栏人工智能头条

深度学习和自然语言处理中的Attention和Memory机制

44750
来自专栏量化投资与机器学习

从Seq2seq到Attention模型到Self Attention(一)

近一两年,注意力模型(Attention Model)是深度学习领域最受瞩目的新星,用来处理与序列相关的数据,特别是2017年Google提出后,模型成效、复杂...

51140
来自专栏AI科技大本营的专栏

福利 | 图像的语义分割—CRF通俗非严谨的入门

本文节选自《深度学习轻松学》第九章—图像的语义分割,作者冯超。 福利提醒:想要获得本书,请在评论区留言,分享你的深度学习经验,第8、18、28、38以及48楼...

95160
来自专栏AI科技评论

ACL论文 | 深度学习大神新作,神经网络的自然语言翻译应用

在 8月7日在德国柏林召开的2016 计算语言学(ACL)大会上,学者Thang Luong、Kyunghyun Cho 和 Christopher D. Ma...

37150
来自专栏AI科技评论

科普|机器学习中决策树的原理与算法

AI科技评论按:本文作者栗向滨,中科院自动化所复杂系统国家重点实验室研究生毕业,机器学习与计算机视觉方向算法工程师。雷锋网首发文章。 我们知道,在机器学习中有两...

38060

扫码关注云+社区

领取腾讯云代金券