(x)
这里我们来实现一下最近的质心算法,看看该算法具体是如果实现的。...可以看到每条数据都有4个特征项分别是: 萼片的长度,萼片的宽度,花瓣的长度,花瓣的宽度
y是x里每条数据对应的分类:
[0, 0, 1, 1, 2, ...]...可以看到x里对应的分类总共有3种[0,1,2]。...2 训练模型
求出了每种分类里的数据每个特性项的平均值:
{0: [[5.1, 3.5, 1.4, 0.2],
[4.9, 3.0, 1.4, 0.2],
... ...],...对每条记录,计算其与每个聚类中点之间的距离并保存在一个数组里,计算距离公式有很多,欧式距离,曼哈顿距离等:
[[8.512, 2.321, 4.576]]
可以看到待预测数据属于分类0,1,2的距离被计算出来了