前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >机器学习---KNN分类任务代码实现

机器学习---KNN分类任务代码实现

作者头像
阑梦清川
发布2025-03-02 22:01:20
发布2025-03-02 22:01:20
5800
代码可运行
举报
文章被收录于专栏:学习成长指南
运行总次数:0
代码可运行

1.KNN算法原理(代码解读)

代码语言:javascript
代码运行次数:0
复制
# 导包
import numpy as np
import matplotlib.pyplot as plt

下面的是样本的数据集和对应的标记(使用数字0,1进行区别表示)

下面的这个数据特征,实际上就是我们二维坐标平面上面的数据点罢了

代码语言:javascript
代码运行次数:0
复制
# 样本特征
data_X = [
    [1.3, 6],
    [3.5, 5],
    [4.2, 2],
    [5, 3.3],
    [2, 9],
    [5, 7.5],
    [7.2, 4 ],
    [8.1, 8],
    [9, 2.5]
]

下面的这个就是标记:0,1表示两类的数据

代码语言:javascript
代码运行次数:0
复制
# 样本标记
data_y = [0,0,0,0,1,1,1,1,1]

使用下面的这个np.array把我们的列表类型转换为数组:

代码语言:javascript
代码运行次数:0
复制
# 训练集
X_train = np.array(data_X)
y_train = np.array(data_y)

为了清晰看到这个具体内容,我们可以看看这个转换之后的结果:

我们也可以采用下面的这个方法,调用plt绘图方法,把这个数据可视化展现出来:

  • 我们绘制的话需要知道不同的点的具体的这个坐标,这个如何获取呢,我们可有看一下这个操作的方法,学习一下;
  • ytrain==0,就是为了使用布尔值表示不同的标记类型的数据,如果标记是0,这个时候布尔值的显示就是true,否则就是flase;
  • 然后取出来这个y_train0的训练集数据,予以公示四个,剩下的都是y_train1,也就是标签都是1;
  • 接下来的这个9,10就是分别使用这个方法里面的第二个属性取出来横坐标和纵坐标,0表示的就是横坐标,1表示的就是纵坐标;

使用散点图的方式进行绘制,不同的标记使用不同的图样进行绘制方便我们进行不同的标记之间的区分;调用plt.show()把这个图像展示出来;

上面的这个是给定的数据,我们如何使用散点图表示不同的标记点之间的关系,如果新给了一点,也就是新的样本点,我们如何把这个新的样本点添加到我们的这个散点图里面去呢?

可以使用下面的这个方法,分别获取这个新的样本点的横坐标和纵坐标,使用新的marker进行标记即可;

2.KNN是如何进行预测的

首先我们需要知道,之前的10个数据的特征都是已知的,我们需要做的就是把这个位置的样本点进行标记,确定他是属于哪一类里面的;

因此我们需要计算这个新的样本点和原始数据之间的距离:

在计算出来的距离的基础上面,对于数据进行排序:

接下来就是确定这个k值(不清楚的伙伴可以去看之前的那个理论介绍的文章,k就是我们以几个数据点作为依据),当然这个k的选择是有讲究的,但是现在我们暂时不深究,假设k=5(随机选择的);

确定这k个参考点里面的不同类别的个数:即0有几个,1有几个;

进行预测:这个里面的23后面有两个[0],这个里面的第一个表示取出来0下标的元组,第二个0表示取出来这个元组里面的第一个数字,实际上这个里面(22行打印的结果里面)只有一个元组

3.scikit-leran直接调用

导包,传入k值(对于创建的实例传参)

参数是二维数组,我们需要的是一维数组,所以需要使用这个reshape方法进行维度的转换,然后进行预测,是不是很快?得到的结果是一样的

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-03-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.KNN算法原理(代码解读)
  • 2.KNN是如何进行预测的
  • 3.scikit-leran直接调用
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档