花掉最有价值的5分钟:只要你看过快乐大本营,就能明白神经网络!

清晰透彻的概念是一切认知的基石。要了解人工智能首先要建立一个基本的思维框架。人工神经网络无疑是绕不过去的一个概念。好在这个概念简单到可笑的程度。花5分钟,读懂她。你的认知就延伸到了广阔的AI时代。

我们这个学习圈子里,大多数人应该都看过大刘的科幻小说《三体》,即使没看过也一定听说过这套斩获雨果奖(被称作科幻界的诺贝尔奖)的作品。《三体》里面有一个场面给人的印象很深:在三体世界里面,为了更好的完成复杂的计算,3000万个三体人排列成一个巨大的方阵。每个人模拟简单的二进制计算。

三体

这样一个复杂的计算就可以通过这个方阵里的每个三体人的简单动作迅速完成。这其实就是一个人肉版的CPU。真的CPU只是比这个方阵“人数多、动作快、出错率低”而已。上期我们讲过将用人工智能的方式让认知模型的升级,今天我们通过一个“三体”式的“人肉版神经网络游戏”来讲讲让人望而生畏的神经网络。

下面文字节选自《三体》。

其中秦始皇,冯.诺伊曼都是三体人。

秦始皇说:“朕当然需要预测太阳的运行,但你们让我集结三千万大军,至少要首先向朕演示一下这种计算如何进行吧。”

“陛下,请给我三个士兵,我将为您演示。”冯.诺伊曼兴奋起来。

“三个?只要三个吗?朕可以轻易给你三千个。”秦始皇用不信任的目光扫视看着冯.诺伊曼。

“伟大的陛下,您刚才提到东方人在科学思维上的缺陷,就是因为你们没有意识到,复杂的宇宙万物其实是由最简单的单元构成的。我只要三个,陛下。”

秦始皇挥手召来了三名士兵,他们都很年轻,与秦国的其他士兵一样,一举一动像听从命令的机器。

“我不知道你们的名字,”冯.诺伊曼拍拍前两个士兵的肩,“你们两个负责信号输入,就叫‘入1’、‘入2’吧。”他又指指最后一名士兵,“你,负责信号输出。就叫‘出’吧,”他伸手拨动三名士兵,“这样,站成一个三角形,出是顶端,入1和入2是底边。

下面我教大家一个比斗地主简单一百倍的游戏,一个人肉版的“人工神经网络”。

1.神经网络相当于团队版“你比划我猜”

“你比划我猜”这个游戏相信大家都玩过。湖南卫视的快乐大本营经常玩这个游戏。我们就拿他们来做例子。这游戏一般是这么玩的:主持人给谢娜一个人偷偷看一张图,比如说“波斯猫”。然后谢娜用动作“比划”给何炅。何炅根据谢娜比划的动作猜谢娜看到的是什么东西。

你比划我猜游戏

这个游戏不是1个谢娜和1个何炅在玩,而是1队谢娜和1队何炅在玩。这个游戏这么玩:

第一步,主持人把要猜的图裁剪成好几块,给每个谢娜看其中一片;

第二步,每个谢娜都比划自己看到的那一片是什么给后面的所有的何炅看(注意是所有的何炅而不是某个何炅);

第三步,所有的何炅们开会商量一下,他们看到的是什么并且告诉主持人;

第四步,当所有的图都猜完,主持人告诉何炅们总共猜对了多少;

第五步,每个何炅根据主持人给出的结果调整自己信哪几个谢娜多一些哪几个少一些或者根本不相信;

第六步,重新再玩一局游戏猜同样的图,看看能不能猜对更多;

第七步,何炅们调整到猜对的得分没有办法再提高,游戏结束。

如果你已经明白这个游戏怎么玩了。恭喜你,你已经掌握了人工神经网络的算法。这个由“一队谢娜+一队何炅+他们最终形成的信任关系”所组成的团队就是一个训练好的“人工神经网络”模型!

同学们可能会说,这么简单,听起来一点都不高深啊,而且和“神经”看上去也没有毛线关系啊?下面我们试着用专业名词来描述这个“团队版你比划我猜游戏”,大家再体会一下。

我们把参与游戏的人称之为“神经元”,把每一队称之为一“层”,把谢娜队称之为“输入层”,把何炅队称之为“输出层”,把给谢娜看的主持人知道答案的图称之为“标记数据”,把主持人知道答案的所有的图叫做“训练集”,把何炅们猜对了多少称之为“成本函数”,把每个何炅对每个谢娜的信任关系称之为“权重”,把整个游戏称之为“有监督学习”,把何炅们商量怎么调整信任关系称之为“梯度递减算法”。替换完毕,我们再描述一下这个游戏:

第一步,将训练集中的数据序列化并且交给输入层神经元;;

第二步,输出层神经元根据当前的权重和输入层神经元获得的数据计算输出;

第三步,输出层神经元根据输出数据计算结果;

第四步,整个训练集第一轮计算完毕,采用成本函数计算本轮成本;

第五步,采用梯度递减等算法调整一点权重以获得成本函数降低(识别率提升);

第六步,调整权重后重新迭代一次上述过程;

第七步,当成本函数达到极小值,模型训练结束。

这个游戏的风格是不是和三体的人肉版CPU类似?说个题外话,据说三体中的人肉版CPU在2007年科幻奇幻大会上实践过。我在想:是不是有一天我们也可以在某个聚会上实践一把“人肉版神经网络”?

2.计算机版的“神经网络”和人肉版的有什么区别

跟《三体》里面的人肉版的CPU一样,人肉版的神经网络只是展示人工神经网络最基本的原理。那计算机版的会有什么区别呢?

最重要区别,计算机版的神经网络不止有一队谢娜和一队何炅,在他们中间可能还存在一队杜海涛,一队吴昕和一队李维嘉等等。这些队伍,统称“隐含层”。我们还听说过一个名词叫做“深度学习”。实际上所谓的“深度学习”的“深度”就是指在输入和输出层之间还有很多很多隐含层,也就是在谢娜队和何炅队之间有很多其他人的队。

当然,计算机版的计算能力强,每一轮游戏猜的图很多。多到什么程度呢?上百万级甚至更高。其实人工神经元早在1943年就被McCulloch和Pitt设计出来了,1986年Dechter将深度学习引入到人工智能领域。你也许会问,那这31年科学家都在干嘛?那是因为用于训练的数据不够多,所以效果一直没有现在这么牛,训练出来的效果不够好,显得没有那么智能。

好了,今天的内容有一丢丢烧脑。但是这绝对是值得的,因为今天我们通过一个常见的游戏说明了当前人工智能最重要的算法原理:人工神经网络。建立了这个基本概念,你就算是一只脚迈进人工智能时代了。你看,人工智能其实也没有那么难。

也许你会问,这是真的吗?一个毫无数学基础的我就这么明白了高深的“神经网络”了?这个听起来真的没有传说中的那么神奇!爱因斯坦曾经说过:美,本质上中就是简单的。至于这种简单的方法如何创造奇迹,我们在今后的AI微认知中会讲到。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180104B0BB6700?refer=cp_1026

同媒体快讯

相关快讯

扫码关注云+社区