《算法图解》note 10 K近邻算法1.K近邻算法简介2.python实现方式3.K近邻算法的优缺点

这是《算法图解》第十篇读书笔记,内容主要是K邻近算法的介绍。

1.K近邻算法简介

K近邻算法(K-nearest neighbor)是一个给定训练数据,根据样本数据最近的K个实例的类别来判断样本数据的类别或数值的算法。该算法可细分为两种类型:判断样本类别的分类算法,计算样本数据的值的算法。

2.python实现方式

可用python的scikit-learn包实现K近邻算法。 调用包的方式如下:

from sklearn import neighbors
#K近邻算法的分类算法
classifier=neighbors.KNeighborsClassifier()
#K近邻算法的回归算法
regressor=neighbors.KNeighborsRegressor()

3.K近邻算法的优缺点

3.1优点

(1)可处理分类问题和回归问题。 (2)适合大样本情况下的自动分析。

3.2缺点

(1)计算量大。 (2)样本不平衡时,对稀少类的分率准确率较低。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

3 条评论
登录 后参与评论

相关文章

来自专栏数据处理

梯度下降求损失函数Minimizing cost functions with gradient descent

1382
来自专栏用户2442861的专栏

python 逻辑回归

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/haluoluo211/article/d...

781
来自专栏杨熹的专栏

Machine Learning Notes-Linear Regression-Udacity

什么是 Regression? Regression 就是想找到因变量和自变量之间的关系,用一个函数来表示,并且可用这个函数来预测任意一个新的 x 会有怎样的 ...

3394
来自专栏张俊红

支持向量机详解

总第81篇 (本文框架) 01|概念及原理: 支持向量机是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器。 说的通俗一点就是就是在特征空...

3043
来自专栏Python中文社区

机器学习算法KNN简介及实现

KNN(K近邻算法)是一种不需要学习任何参数同时也非常简单的机器学习算法,既可以用来解决分类问题也可以用来解决回归问题。直观解释这个算法就是'近朱者赤,近墨者黑...

1002
来自专栏IT派

推荐|数据科学家需要了解的5大聚类算法

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 聚类是一种涉及数据点分组的机器学习技术。给定一个数据点集,则可利用聚类算法将每个数据点分类...

2987
来自专栏有趣的Python和你

sklearn调包侠之线性回归

如图所示,这是一组二维的数据,我们先想想如何通过一条直线较好的拟合这些散点了?直白的说:尽量让拟合的直线穿过这些散点(这些点离拟合直线很近)。

641
来自专栏https://www.cnblogs.com/L

【机器学习】--机器学习之朴素贝叶斯从初始到应用

机器学习算法中,有种依据概率原则进行分类的朴素贝叶斯算法,正如气象学家预测天气一样,朴素贝叶斯算法就是应用先前事件的有关数据来估计未来事件发生的概率。

842
来自专栏null的专栏

简单易学的机器学习算法——线性可分支持向量机

一、线性可分支持向量机的概念     线性可分支持向量机是用于求解线性可分问题的分类问题。对于给定的线性可分训练数据集,通过间隔最大化构造相应的凸二次优化问题可...

3585
来自专栏机器学习算法原理与实践

scikit-learn 梯度提升树(GBDT)调参小结

    在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参...

1023

扫码关注云+社区