专栏首页机器学习算法与理论无监督:聚类与改进聚类详解

无监督:聚类与改进聚类详解

聚类: 聚类就是将相似的对象聚在一起的过程。如总统大选,选择那部分容易转换立场的表决者,进行针对性的宣传,可以扭转局势。 聚类将相似的对象归到同一簇中,相似取决于相似度度量方法。 K-means聚类,可能收敛到局部最小值,在大规模数据集上收敛较慢。 K-means聚类:首先,随机确定k个初始点作为质心,将数据集中的每个点分配到一个簇中,即选择一个最近的质心进行分配,而后每个簇的质心更新为该簇所有点的平均值。 直到类间距离足够大,类内距离足够小。 随机初始化质心时,必须找到数据集的边界,通过找到数据集中每一维数据的最大和最小值,然后生成0-1之间的随机数并通过取值范围和最小值确保随机点在数据的边界之类。

用于度量聚类效果的指标可以是SSE(误差平方和)。我们可以通过增加簇的数量来减小SSE,若想要保持簇的总数不变,可以将某两个簇进行合并。 合并的方法:(1)合并最近的质心;(2)合并两个使得SSE增幅最小的质心,该方法必须在所有可能进行合并的簇之间做计算SSE。

二分K-means: 首先将所有点作为一个簇,然后将该簇一分为二,之后选择一个簇继续进行划分,选择哪一簇取决于 对其划分是否可以最大程度上降低SSE的值(类似于决策树的思想),不断划分,直到得到指定的簇的数目。

应用:对地图上的点进行聚类,从而用比较合理的大巴接送方案完成一个活动或一次旅行。 为出租车和乘客选择合适的候车点等。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 基于面部视觉的疲劳检测-哈欠

    基于视觉的疲劳检测可以认为大致分为三个部分,点头,哈欠,眨眼。分别为姿态、嘴部特征、眼部特征。 本文主要介绍哈欠的测定方法。 首先研究了陈博士《基于可拓学与面部...

    微风、掠过
  • 深度学习核心技术实战 NLP-word2vec

    多分类的逻辑回归- softmax模型 word2vec:词向量 one-hot representation 对应位置为1,但不能表达词之间的关系 本质...

    微风、掠过
  • 基于Triplet loss函数训练人脸识别深度网络(Open Face)

    Git:  http://cmusatyalab.github.io/openface/ FaceNet’s innovation comes from fo...

    微风、掠过
  • Apple Swift编程语言入门教程

    今天凌晨Apple刚刚发布了Swift编程语言,本文从其发布的书籍《The Swift Programming Language》中摘录和提取而成。希望对各位的...

    sanmutongzi
  • K-means中K值的选取

    以下博文转自:https://blog.csdn.net/qq_15738501/article/details/79036255  感谢

  • 分类问题 数据挖掘之分类模型

    判别分析是在已知研究对象分成若干类型并已经取得各种类型的一批已知样本的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析。

    用户2909867
  • 理论:聚类算法思路总结

    常见的为欧式距离(L1 norm)&&p=2,拓展的可以有闵可夫斯基距离(L2 norm)&&p=1:

    sladesal
  • 【干货】Python无监督学习的4大聚类算法

    新智元
  • R语言之实现K-mean聚类算法

    聚类算法作为无监督的学习方法,在不给出Y的情况下对所有的样本进行聚类。以动态聚类为基础的K均值聚类方法是其中最简单而又有深度的一种方法。K均值的好处是我们可以在...

    一粒沙
  • 基础聚类算法:K-means算法

    一、算法简介: 俗话说:“物以类聚,人以群分”,聚类算法不同于分类算法,对于一个 分类器 ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一...

    智能算法

扫码关注云+社区

领取腾讯云代金券