Kmeans聚类算法

kmeans算法步骤

  • 第一步 - 随机选择 K 个点作为点的聚类中心,这表示我们要将数据分为 K 类。
  • 第二步 - 遍历所有的点 P, 算出 P 到每个聚类中心的距离,将 P 放到最近的聚类中心的点集中。遍历结束后我们将得到 K 个点集。
  • 第三步 - 遍历每一个点集,算出每一个点集的中心位置,将其作为新的聚类中心。
  • 第四步 - 重复步骤 2 和步骤 3,直到聚类中心位置不再移动。

如何确定K值

在确定K的时候,可以测试10个不同的聚类中心,然后绘制K与误差平方和的曲线图,找到曲线的拐点,即是合适的K值。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python的二分查找库:bisect

    故事尾音
  • 卷积神经网络复习

    卷积神经网络主要包括3层,即:卷积层、池化层以及全连接层。本文讲分别细致介绍这三层的作用和计算来复习一下卷积神经网络。本文采用简单的LeNet来讨论这些问题,模...

    故事尾音
  • BiliBili蒙版弹幕

    首先打开Mask_RCNN/samples notebook,运行。 出现两个错误:

    故事尾音
  • ML:教你聚类并构建学习模型处理数据(附数据集)

    数据派THU
  • 腾讯视频云 LiteAVSDK 更新公告

    腾讯视频云 LiteAVSDK 升级到 5.4.6097 SDK 内核优化 iOS&Android:优化网络协议算法,直播推流抗 30% 丢包无压力; iOS...

    腾讯云视频
  • 分类问题中的维度诅咒(下)

    换句话说,如果可用训练数据的数量是固定的,我们继续添加维度的话,则会发生过拟合。另一方面,如果我们不断增加维度,训练数据的数量需要快速增长以保持相同的覆盖,并避...

    哒呵呵
  • jQuery仿淘宝登录拖动滑块验证插件优化版

    今天写项目的时候需要一个拖动滑块验证功能,就在网上找了一个,但是有一点小 bug ,我优化了一下,分享给大家。效果如下图:

    德顺
  • C-MHAD:多模态/连续动作检测数据集(附数据+Baseline代码)

    2020年,UTD Embedded Machine Learning Lab 发布了一个新的多模态(视频+惯性传感)连续运动检测数据集。基于这个数据集,作者也...

    代码医生工作室
  • 浅谈iOS进阶路线

    筑梦师winston
  • 测试人员如何避免背黑锅

    “背锅”的事儿笔者经历了很多,分享一下我的感受。由于文笔所限,可能会导致部分内容有“引战”的嫌疑,如果有请告知,笔者希望本文的分享是给您带来一些新思路,...

    张树臣

扫码关注云+社区

领取腾讯云代金券