前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >k-近邻分类算法

k-近邻分类算法

原创
作者头像
一口盐汽水
修改2020-11-18 11:46:15
9550
修改2020-11-18 11:46:15
举报

从样本中找与预测样本距离最近的k个数据

这k个数据所属类别投票决定了预测样本的类别

距离公式:

d_ab=\sqrt[n]{\sum_{i=1}^m |a_i-b_i|^n}

余弦相似度:

cos\Theta = \frac{\sum_{i=1}^m(a_i * b_i)}{\sqrt{\sum_{i=1}^m a_i^2}*\sqrt{\sum_{i=1}^m b_i^2}}

其中,a,b为包含m个属性的样本,属性计算时要进行规范化(最大最小值规范化或零均值规范化等)

其中 n=1 时曼哈顿距离,n=2是欧式距离,n \to \infty 是切比雪夫距离

最大值最小值规范化:

v=\frac{x-l}{r-l}(R-L)+L

其中原来取值区间L,R,映射区间l,r,原值x,映射值v

零均值规范化:

v=\frac{x-\mu_A}{\sigma_A}

其中\mu_A均值,\sigma_A标准差,原值x,映射值v

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档