文章/答案/技术大牛

发布

“怡工”讲述：从买芒果、认小猫，揭开人工智能的神秘面纱…（二）

文章来源：企鹅号 - 怡化

怡化确立深耕金融的发展定位以来，大范围接触、发现、招募、启用了一批金融科技领域的专家学者。作为人工智能入口和基础应用的生物特征识别，已成熟应用于怡化的智慧银行解决方案中，为金融场景服务带来科技新体验。

12月18日，微信公众号推出《“怡工”讲述：从买芒果、认小猫，揭开人工智能的神秘面纱……》，笔者结合实际工作经验与整体受众认识程度，尝试以较为直观易懂的方式为大家解读“人工智能”。接下来，有请“怡工”继续讲述：

了解机器学习的概念后，让我们来看一下机器学习的分类。机器学习的种类有：监督学习、无监督学习、增强学习，如下图。

什么是分类

为了让大家可以更直观的认识分类，咱们先来看一些例子。

竖线左边的是芒果，右边的是苹果，这就是一个简单的水果分类。通过一条直线把芒果和苹果区分开来是不是很简单？这种一分为二的直线，我们可以把它看做是一个人工神经网络中的每一个人工神经元在做的事。

现在呢？让我们再增加一条横线。

通过两条直线，可以把它们分为：黄芒果、青芒果、红苹果、青苹果，4个类别。虽然每一个人工神经元的工作都很简单（一分为二），但如果有更多的神经元，比如3万个，理论上我们可以得到230000种分类……

当然，我们是开启了“上帝视角”才能够把上图中的水果进行准确的分类。在实际的神经网络模型中，机器是无法立刻知道该如何分类的。

那么，机器是怎么学习分类的呢？

监督学习

假设机器要分辨出图中的黄芒果，它先是“随意的”画上一条初始直线（关于初始直线的选择，有很多更好的方法，但对于这个例子来讲，并不关键），可能是这个样子的。

我们把多画进去的青芒果和红苹果，叫做误差。或者可以这样去理解误差：机器在分类黄芒果时，会错误的把青芒果和红苹果也判断为黄芒果。

接下来要做的事情，就是缩小这个误差。

我们把一些黄芒果的样本输入给机器，并通过“标签”告诉机器，这些都是黄芒果。然后，机器会开始学习并提取黄芒果的特征，同时缓慢的调整直线的位置，当它变化成直线2的时候，误差缩小了（不会再把红苹果误认为黄芒果），但是还不够理想，所以我们让机器继续学习（给它更多的黄芒果样本），最终它会停留在直线3的位置，结束学习。

由于我们会通过“标签”告诉机器，什么才是黄色的芒果，所以我们把这种机器学习的方法，叫做监督学习。

无监督学习

既然有监督学习，那肯定也有无监督学习的方法。

谷歌大脑的创始人之一，美籍华人吴恩达先生，他所在的团队X-lab模拟了包含300万个人工神经元的巨大网络，通过无监督学习方法，在没有任何标签输入（人工纠错）的情况下，机器仅仅通过“观看”视频，就可以学习得出“猫”的概念，这就是著名的“Google Cat”。这个技术已经被应用到了安卓的语音识别系统中。

最常见的无监督学习就是聚类。

什么是聚类

聚类的目的是，使同一类对象的相似度尽可能地大，不同类对象之间的相似度尽可能地小。

我们可以通过上图的三个圈，根据颜色来进行聚类，得到黄色的水果、红色的水果和青色的水果，3种类别。

或者这样，根据形状来进行聚类，得到类椭圆的水果和类圆的水果，2种类别。

如果把上面的两个图结合起来，假设有两层神经网络，第一层根据颜色进行聚类，第二层根据形状进行聚类，那么最终我们会得到“黄色的、类椭圆水果”这一类别。

这看起来和分类的工作很像，但它们并不一样。分类是事先定义好类别（黄芒果、红苹果），有人工标签的指导性学习，我们有明确的告诉机器，这些输入的样本是黄芒果。聚类的时候，我们并不会告诉机器输入的是什么，由机器将相似的样本聚在一组，这样的一组对象叫做簇（类别），机器会对每一个簇进行输出描述（黄色的、类椭圆水果）。

一种理论上的解释方法

前面的文章说过，人工神经网络对我们来说是不透明的，网络中的特征和权重是机器在自动学习后的结果，至于每一个特征的具体含义，以及为什么要使用这些权重值，是我们无法理解的。

我们能否找到一些方法，用来解释人工神经网络，是通过什么样的方法来进行分类或聚类的？或者让问题更具体一些：为什么机器可以判断一张图片中有人脸？

回忆一下，我们关于“这个芒果好吃吗”的感知器模型。

现在，让我们用相同的方法，建立一个“图片中有人脸吗”的问答模型。我们希望机器能够明确的回答我们“是的，有人脸”或“不，没有人脸”。

很明显，这些问题还可以继续被分解，比如“有眼睛吗？”这个问题，我们可以把它分解成以下的子问题。

子问题还可以继续被分解，这看上去很合理。机器把每一个问题都逐步分解、细化，通过更多的网络层次，逐步传递，甚至可以出现“像素点是黑色的吗”这种问题。

最终的结果是，我们将一个对机器来讲非常复杂的问题“图片中有人脸吗？”，分解成了若干个可以明确回答的简单问题。如果这些问题中，大多数的答案是“是”，机器就认为这张图片中有人脸，否则，这张图片中可能没有人脸。

这并不是一个人脸识别算法的真实原理，而是帮助我们去理解，为什么机器可以判断图片中有人脸的一种理论上的解释方法。

我们能做什么？

神经网络并没有想象中的那么高深莫测，Michael Nielsen在他的《Neural Networks and Deep Learning》书中仅仅用了74行代码，就完成了针对MNIST数据集的手写数字识别系统，这一段短小代码的识别率超过了96%，通过优化后可以达到99%以上。

神经网络可以被用来学习解决许多现实世界的问题，这也正是机器学习有趣的地方。

想象一下，怡化现金设备中的大量运行日志，通过神经网络和机器学习，是否可以提前分析出，什么时候、什么设备可能会出故障（比如读卡器电压值与夹卡故障的因果假说），从预防性维护升级到预测性维护。或者，让我们的设备具备“识别与分析”的能力，可以认清客户，不再是一款冷冰冰的机器。

笔者会在后续的文章中尝试探讨：在AI面前，我们能够做些什么？（未完待续……）

文＿创新实验室熊雄

发表于: 2019-01-042019-01-04 16:36:05
原文链接：https://kuaibao.qq.com/s/20190104B0WMKA00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

“怡工”讲述：从买芒果、认小猫，揭开人工智能的神秘面纱…（二）

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐