前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《统计学习方法》笔记三 k近邻法

《统计学习方法》笔记三 k近邻法

作者头像
闪电gogogo
发布2018-12-04 11:09:17
5100
发布2018-12-04 11:09:17
举报

k近邻是一种基本分类与回归方法,书中只讨论分类情况。输入为实例的特征向量,输出为实例的类别。k值的选择距离度量分类决策规则是k近邻法的三个基本要素。

k近邻算法

给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。

k近邻法没有显示的学习过程。

k近邻模型

距离度量

一般为欧式距离,Lp距离、Minkowski距离等

由不同的距离度量所确定的最近邻点是不同的。

k值的选择

k值小时,k近邻模型更复杂,容易发生过拟合;k值大时,模型更简单。k值的选择反映了对近似误差与估计误差之间的权衡,通常由交叉验证选择最优的k。

分类决策规则

常用的分类决策规则是多数表决,对应与经验风险最小化。

k近邻法的实现:kd树

构造kd树算法如下:

搜索kd树即回溯法:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018-10-27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • k近邻算法
  • k近邻模型
    • 距离度量
      • k值的选择
        • 分类决策规则
        • k近邻法的实现:kd树
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档