带你通俗易懂的理解人工智能算法一

文章来源：企鹅号 - AIStart

我们所谓的人工智能算法就是一个机器嵌入了这个算法后，这个机器就拥有了人所具有的基本能力，比如观察、思考、学习、创造等，本文要说的就是这个算法。

人工智能算法主要由两部分组成：深度学习（Deep Learning）和强化学习(Reinforce Learning)

深度学习

深度学习就是多层人工神经网络。

它主要包括三个部分：输入层、隐藏层、输出层。输入层就是机器的输入数据，比如我们问它："你吃了吗？"，而隐藏层就是对这句话的特征提取和分析的过程，机器想我今天到底有没有吃，然后输出层就是结果，比如机器人说 :"吃了"，就是输出层。

强化学习

强化学习相当于建立了一个机器与环境交互的过程。

强化学习主要包括两个部分，一个是Agent，就是机器。一个是Environment环境。对于Agent来说，外面的任何事物包括天气、光线、张三、李四都是环境。比如今天Environment很冷，就是Enviroment当前时刻的State是“冷”，现在Agent机器知道了有点冷，它就执行了一个Action动作，把衣服脱了。然后环境就知道了机器把衣服脱了，天冷了脱衣服不对啊，所以Enviroment环境就给了Agent一个负的Reward，因为它的Action不对。然后Environment又给了Agent当前时刻的State：“冷”，这时候Agent吸取上次的教训，就把衣服穿上了。Environment知道Agent把衣服穿上了，是个正确的行为，所以就给了Agent正的Reward。所以以后环境冷的时候，Agent就知道要穿衣服了。

神经网络基本实现

神经网络的基本单元：神经网络的基本单元就是神经元，第一层的神经元是我们的输入数据，是已知的。第二层每个神经元相当于一个函数，它接收输入值x，经过函数映射得到输出值y，然后把y作为下一层的x。这样依次类推，到最后一层，得到最后一层的值。

神经网络的本质：就是一个分类算法，所谓的分类算法就是一个公式，根据不同的输入X，经分类算法映射得到的y就是分类结果。就像我们输入猫的图片，得到的就是一个猫的标签或者狗的预测，这就是分类。

神经网络的简化表达：y = AX+b，y是分类结果，同时y也被称为预测值，X是输入值，A和b是公式参数。

神经网络的目标：调整A,b的值，使预测值和真值越来越接近，直到它们的差值小于等于我们设定的阈值。其中真值就是上面说的图片的标签，预测值就是公式的结果y。

神经网络的实现主要两个步骤：一是网络的搭建，二是网络的训练。

网络的搭建就是我们的神经网络要设计成几层，每层有多少个神经元，层与层之间是怎么连接的。我们理解的当然层数越多，神经元越多，这个神经网络越强大。但是当太多的时候会出现一个过拟合的现象。就是随着层数增多，效果不一定就越好，要根据激活函数、正则项、层与层的连接方式等结合起来考虑。

网络怎么训练呢，我们就拿已经贴好标签的猫狗的图片来训练。猫的图片我们就贴标签“猫”，狗的图片我们就贴标签为“狗”。首先我们把猫的图片输入到神经网路中，如果神经网络判断这个图片是猫，那就不去管神经网络里面的参数，如果神经网络判断猫的图片是狗，那就使用反向传播算法更新神经网络的参数。更新原则就是最小化真值和预测值之间的差值。

网络搭建好，神经网络的模型训练好之后，就可以拿模型来识别是猫狗的图片了。

其实个人观点是，深度学习还是在强化学习的范畴内的。现阶段来看强化学习仍然是人工智能的top-level算法，至于对抗生成网络，去年火起来，今年进展不大，倒是基于强化学习的AlphaGo突飞猛进。至于什么时候能够开发出超强的人工智能算法，让我们拭目以待吧！

发表于: 2017-12-212017-12-21 07:08:05
原文链接：http://kuaibao.qq.com/s/20171221A02H7E00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

带你通俗易懂的理解人工智能算法一

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐