前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >k均值聚类(1)

k均值聚类(1)

原创
作者头像
一口盐汽水
修改2020-11-19 11:34:40
1.2K0
修改2020-11-19 11:34:40
举报

分k个簇,起始随机选择k个点为簇的初始质心,选取距离k个质心最近的一个加入那个簇,之后更新质心,即簇内所有数值的平均,之后继续重复直到质心不再变化或者小于一个阈值。

数据集D中n个对象,D= \{o_i=(x_i1,x_i2,...x_in),i=1,2,...n\}

簇的集合C=\{C_1,C_2,...C_k\},C_i=\{o_1,o_2,...ol\} \subseteq D,第i个簇的质心c_i=\{y_{i1},y_{i2},...y_{im}\}

y_{ij}=\frac{1}{|C_i|} \sum_{o_l \in C_i} x_{lj}

簇内距离平方和:可以做评价指标,多次以不同的初始质心运行,选取得到最小SSD的结果

SSD={\sum_{i=1}^k\sum_{o_j \in C_i} d(o_j,c_i)}

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档