首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习-kNN实现简单的手写数字识别系统

不积跬步,无以至千里

### 功能

利用k-邻近算法,实现识别数字0到9

### 开发环境

Mac

Python3.5(Anaconda)

PIL

numpy

### 数据集和项目源代码

Github:https://github.com/jiangkang/KMachineLearning.git

### 数据集

下面是32*32的黑白图像

32* 32像素数据集

为了方便处理,提供了文本文件

文本数据

数据集分为训练集和测试集,其中训练集是已经分类好的数据,测试集是用来测试算法。

### 将数据转换为特征向量

从上图可知,拿到的是32*32的的矩阵,每一个点是一个像素值,将这1024(32

✖️32)个数值,转换成(1,1024)的向量。

数据转换为特征向量

### KNN分类器

参考这篇文章机器学习-从kNN开始

kNN分类器

### 输入测试集,测试算法

测试算法

### 看看选择不同的k值,分类效果如何

取不同的k值

这里看错误的个数,绘制一个折线图

注意:执行时间比较长,去喝杯咖啡吧

这里取1-4,当然你也可以取更高的k值(速度慢)

实验结果证明,取k=3,效果比较好。

### txt转换为png图像

为了更具真实性,同样写了txt转换为png的代码。

txt转png

### 图像转txt文件

image.png

### 总结

数据集如果稍大一点,执行时间会变得非常长

超光速

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180330G1YUVM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券