机器学习之神经网络初识

叶子陪你玩

发布于 2020-06-01 11:03:05

4140

发布于 2020-06-01 11:03:05

听过人工智能，机器学习，神经网络，深度学习等很多名词，你可能看了很多解释也似懂非懂，之前我也是同样如此的，主要是觉得自己用不着，也不用接触这么高级的东西。最近在学习了一些数据分析和机器学习的基础知识后，感觉到还是挺有意思的，就是有一些名称概念太让人生畏了。

人工智能是一个很宽泛的概念，你目前听到的高级概念都是属于人工智能的一部分；机器学习是属于人工智能的一个分支，而机器学习又是一个很大的范畴，简单点说就是专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能。比如人可以通过经验推理预测，根据规则分类等。

之前用过的线性回归，逻辑回归都是属于机器学习中的一种，今天要说的神经网络学习（神经网络）也是机器学习的一种方法；当神经网络的层数变得越来越多，学习的效果变得也越来越好，这也就是深度学习（Deep Learning），本质上可以理解为深层的神经网络。

下面的内容主要来源于《数据科学入门》：

人工神经网络（artifificial neural network，或简称神经网络）是受大脑启发而开发出来的一种预测模型。我们可以把大脑看作一团相互连接的神经元。每个神经元都以其他神经元的输出为输入，进行相应计算，如果结果超过某个阈值，则这个神经元将会进入激活状态，否则它会继续保持非激活状态。相应地，人工神经网络则是由人工神经元组成，同样也对输入进行类似的计算。

神经元

神经元也叫神经细胞，是神经系统最基本的结构和功能单位。分为细胞体和突起两部分。神经网络也就是很多个神经元连接在一起。

抽象一下变成下图

感知器

感知器（perception），也可以称为感知机，可能是最简单的神经网络了，或者说是由具有 n 个二进制输入的单个神经元所组成的神经网络。感知器首先会对输入值加权求和，如果加权和大于等于 0，它就会被激活，模拟神经元对电信号进行反应的函数统称为激活函数：

第一个step_function(x)函数传入一个数据，如果大于等于0，返回结果1，否则返回0，也可以叫做激活函数。

第二个perceptron_output(weights, bias, x)感知机输出函数，函数里的第一行代码通过点乘的方法对对输入值加权求和。

实际上，感知器只是根据点 x 的超平面将问题空间分隔为两部分而已,也就是一个而分类器：

dot(weights,x) + bias == 0

通过正确选用权值，感知器能解决许多简单的问题（图 18-1）。

与门：两个输入均为1时输出1，其他输出0

或门：两个输入均为0时输出0，其他输出1

非门：输入1时输出0，输入0时输出1

异或门：两个输入信号不相同时，输出1，其他输出0

权重weights是控制输入信号的重要性的参数

偏置 bias是调整整个神经元被激活的容易程度的参数。如bias=-3，则输入信号的加权总和必须超过3，神经元才会被激活。

例如，我们可以创建一个与门（即 AND，也就是说，当两个输入都为 1 时，返回 1；只要输入有一个为 0 时，返回0，代码如下所示，weights称为权重，bias叫做偏置。

weights = [2, 2] bias = -3

如果两个输入都为 1，则计算结果为 2 + 2 - 3 = 1，所以输出为 1。但是，只要输入中有一个为 0，则计算结果为 2 + 0 - 3 = -1，所以输出为 0。

同时，如果两个输入都为 0，则计算结果为 -3，所以输出还是 0。同样，我们还可以建立一个或门（OR），代码如下所示：

weights = [2, 2] bias = -1

同样，我们还可以建立一个非门（即 NOT，它只有一个输入端，并且会把输入的 1 转换为0，反之亦然），代码如下所示：

weights = [-2] bias = 1

不过，有些问题是单个感知器所无法解决的，比如，无论你如何尝试，都无法通过一个感

知器来构建异或门（XOR），即两个输入不同时输出为 1，否则输出为 0。这种情况下，我们就需要使用更加复杂的神经网络了。

当然，在建立逻辑门的时候，根本无需惟妙惟肖地模仿神经元，看一眼下面的代码你就明白了：

and_gate = minor_gate = maxxor_gate = lambda x, y: 0 if x == y else 1

就像真实的神经元那样，当你将它们连接起来时，就会发生许多有趣的事情。

前馈神经网络

大脑的拓扑结构极为复杂，我们可以近似地把它看作一个理想化的前馈（feed-forward）神经网络，该网络由多层构成，每层由众多神经元组成，然后逐层相连。一般情况下，前馈神经网络会有一个输入层（接收输入信号，然后无需修改直接向前馈送），一个或者多个“隐藏层”（每层都是由神经元组成，这些神经元以前一层的输出作为其输入，进行某些计算，并将结果传递给下一层），以及一个输出层（这一层提供最终输出）。