开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >K-最近邻算法 >什么是K-最近邻算法？

什么是K-最近邻算法？

修改于 2023-07-25 23:20:40

205

词条归属：K-最近邻算法

K-最近邻算法（K-Nearest Neighbor，KNN）是一种基于实例的学习算法，它可以用于分类和回归。KNN是一种非参数算法，它不需要对数据的分布做出任何假设，而是使用数据中最近的K个邻居的标签来预测新的数据点的标签。

在KNN算法中，每个数据点都可以表示为一个n维向量，其中n是特征的数量。对于一个新的数据点，KNN算法会计算它与每个训练数据点之间的距离，并选择最近的K个训练数据点。对于分类问题，KNN算法会将这K个训练数据点中出现最多的类别作为预测结果。对于回归问题，KNN算法会将这K个训练数据点的输出值的平均值作为预测结果。

在KNN算法中，K的取值是一个超参数，需要根据数据集的特点和算法的性能进行选择。通常情况下，较小的K值可以使模型更复杂，更容易受到噪声的影响，而较大的K值可以使模型更简单，更稳定，但可能会导致模型的欠拟合。

相关文章

[机器学习实战]K-近邻算法

机器学习编程算法

1. K-近邻算法概述(k-Nearest Neighbor，KNN) K-近邻算法采用测量不同的特征值之间的距离方法进行分类。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。优点：精度高、对异常数据不敏感、无数据输入假定。缺点：计算复杂度高、空间复杂度高。适用数据范围：数值型和标称型。 KNN工作原理是：存在一个样本数据集合（训练样本集），并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。

2018-04-16

1.8K0

机器学习神经网络深度学习人工智能编程算法

从今天开始，与大家分享我学习《Machine Learning In Action》这本书的笔记与心得。我会将源码加以详细的注释，这是我自己学习的一个过程，也是想通过这种方式帮助需要学习的童鞋的一种方式。

卡尔曼和玻尔兹曼谁曼

2019-01-22

9790

使用数据范围：数值型和标称型。优点：精度高、对异常值不敏感、无数据输入假定。缺点：计算复杂度高、空间复杂度高。

2018-12-13

7300

[机器学习实战札记] k-近邻算法

编程算法机器学习神经网络深度学习人工智能

《机器学习实战》一书介绍的第一个算法是k-近邻算法。简单的说，k-近邻算法采用测量不同特征值之间的距离方法进行分类。其工作机制非常简单：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。

2019-07-02

1K0

k-近邻分类算法

其中，a，b为包含m个属性的样本，属性计算时要进行规范化（最大最小值规范化或零均值规范化等）

一口盐汽水

2020-11-15

1.2K0

点击加载更多