机器学习|卷积神经网络(CNN) 手写体识别 (MNIST)入门

这篇文档可能还是会非常长,因为机器学习并不是纯软件开发,简单地调用库函数 API,需要有一定的理论支撑,如果完全不介绍理论部分,可能就不知道为什么模型要这样设计,模型出了问题应该怎样改善。

不过文档如果写太长大家可能很难有耐心看完,特别是理论部分会有很多公式,但是机器学习确实又对理论基础和编程能力都有一些要求,相信坚持看下去还是会有很多收获的,我也尽可能把理论和应用都介绍清楚。

之后一篇文档就基本是纯实际应用了,不会有太多理论内容了,用 Darknet 机器学习框架训练一个目标检测模型。

  • 如果对机器学习理论比较清楚,可以直接看第二部分 Keras 训练模型
  • 如果对 Keras 机器学习框架也比较熟悉了,可以直接跳转到第三部分 RT-Thread 加载 onnx 模型
  • 如果对 RT-Thread 和 onnx 模型都很熟悉了,那我们可以一起交流下如何在嵌入式设备上高效实现机器学习算法 :blush:

首先,简单介绍一下上面提到的各个话题的范围 (Domain),人工智能 (Artifitial Intelligence) 是最大的话题,如果用一张图来说明的话:

然后机器学习 (Machine Learning) 就是这篇文档的主题了,但是机器学习依旧是一个非常大的话题:

这里简单介绍一下上面提到的三种类型:

监督学习 (Supervised Learning): 这应当是应用最多的领域了,例如人脸识别,我提前先给你大量的图片,然后告诉你当中哪些包含了人脸,哪些不包含,你从我给的照片中总结出人脸的特征,这就是训练过程。最后我再提供一些从来没有见过的图片,如果算法训练得好的话,就能很好的区分一张图片中是否包含人脸。所以监督学习最大的特点就是有训练集,告诉模型什么是对的,什么是错的。

非监督学习 (Unsupervised Learning): 例如网上购物的推荐系统,模型会对我的浏览记录进行分类,然后自动向我推荐相关的商品。非监督学习最大的特点就是没有一个标准答案,比如水杯既可以分类为日用品,也可以分类为礼品,都没有问题。

强化学习 (Reinforcement Learnong): 强化学习应当是机器学习当中最吸引人的一个部分了,例如 Gym 上就有很多训练电脑自己玩游戏最后拿高分的例子。强化学习主要就是通过试错 (Action),找到能让自己收益最大的方法,这也是为什么很多都例子都是电脑玩游戏

所以文档后面介绍的都是关于监督学习,因为手写体识别需要有一些训练集告诉我这些图像实际上应该是什么数字,不过监督学习的方法也有很多,主要有分类和回归两大类:

分类 (Classification): 例如手写体识别,这类问题的特点在于最后的结果是离散的,最后分类的数字只能是 0, 1, 2, 3 而不会是 1.414, 1.732 这样的小数。

回归 (Regression): 例如经典的房价预测,这类问题得到的结果是连续的,例如房价是会连续变化的,有无限多种可能,不像手写体识别那样只有 0-9 这 10 种类别。

这样看来,接下来介绍的手写体识别是一个分类问题。但是做分类算法也非常多,这篇文章要介绍的是应用非常多也相对成熟的神经网络 (Neural Network)。

人工神经网络 (Artifitial Neural Network):这是个比较通用的方法,可以应用在各个领域做数据拟合,但是像图像和语音也有各自更适合的算法。

卷积神经网络 (Convolutional Neural Network):主要应用在图像领域,后面也会详细介绍。

循环神经网络 (Recurrent Neural Network):比较适用于像声音这样的序列,因此在语言识别领域应用比较多。

最后总结一下,这篇文档介绍的是人工智能下面发展比较快的机器学习分支,然后解决的是机器学习监督学习下面的分类问题,用的是神经网络里的卷积神经网络方法。

本文分享自微信公众号 - 人工智能头条(AI_Thinker)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PowerBI战友联盟

PowerBI 已集成 AI 功能 零代码人人可用

微软的使命是:赋能这个星球的每个人和组织,使他们获得更多。 你有感觉被微软赋能吗?如果你没有感觉到,那有两种可能:要么是你根本不知道不行动,要么是微软还需要努力...

9820
来自专栏大数据和机器学习

lda模型小记

lda模型是一个词袋模型,它认为一个文档由一组关键的词构成,这些词之间没有先后顺序,一篇文档可以有很多个主题,文档中的每个词都来自于这些主题中的其中一个。它是一...

13900
来自专栏Python数据科学

80页笔记看遍机器学习基本概念、算法、模型,帮新手少走弯路

本文要介绍的是一份长约 80 页的学习笔记,旨在总结机器学习的一系列基本概念(如梯度下降、反向传播等),不同的机器学习算法和流行模型,以及一些作者在实践中学到的...

8810
来自专栏Python数据科学

手把手教你入门和实践特征工程 的全方位万字笔记,附代码下载

(注:本节用到了两个数据集,分别是Salary_Ranges_by_Job_Classification 和 GlobalLandTemperaturesByC...

7410
来自专栏机器之心

美人秀色空绝世,我用PS-GAN试伊妆

近日,北京航空航天大学和中国科学院大学等机构的研究者新提出的姿态稳健型空间可感知式 GAN(PSGAN),可以很方便地实现可定制化的妆容迁移,真可谓:美人秀色空...

23130
来自专栏汇智网教程

用sklearn流水线优化机器学习流程

在大多数机器学习项目中,你要处理的数据不大可能恰好是生成最优模型的理想格式。有很多数据变换的步骤例如分类变量编码、特征缩放和归一化需要执行。Scikit-lea...

9130
来自专栏PowerBI战友联盟

饕餮盛宴:微软定义BI未来 新PowerBI全解读

2018 PASS峰会于 11.5~11.9 举行完毕,本文描述PASS峰会中有关PowerBI企业现代商务智能的进展以及未来展望,绝对震撼,超乎想象。

11210
来自专栏PowerBI战友联盟

【必杀】免费体验 PowerBI Premium 旗舰版

PowerBI 战友联盟,是中国范围内由 PowerBI 从业者发起的专业学习现代商业智能的组织,我们以 PowerBI 为主题研究如何帮助企业和个人提升数字化...

12230
来自专栏机器之心

AI提前18个月预测厄尔尼诺自然灾害,已登Nature和Science

可怕的厄尔尼诺每 2 到 7 年就会爆发一次,导致非洲南部出现干旱、南美野火肆虐以及北美太平洋海岸洪水泛滥,有效的厄尔尼诺预警能够减低经济损失。近日,韩国全南大...

11340
来自专栏汇智网教程

小白如何入门机器学习?

机器学习作为人工智能领域的一个重要主题,已经被大家关注相当一段时间了。机器学习提供了有吸引力的机会,进入这一领域工作并不像想像中那么困难。即使你在数学或编程方面...

11040

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励