浅谈神经网络发展史:从莫克罗-彼特氏神经模型到深层神经网络

2016年,随着AlphaGo战胜了李世石,人工智能与深度学习达到了一个空前火热的状态。很多人也是第一次开始接触到了深度神经网络这个概念,但是其实神经网络的历史可以追溯到1943年,1943年的时候,二战都还没有结束。 中间的这段时间里,是由几个标志性的事件影响着神经网络算法的发展,其发展史大概可以分为三个阶段,下面我们就围绕这几个事件简要介绍这三个阶段。

McCUlloch-Pitts Neuron model与感知机的提出

最早的神经网络数学模型由Warren McCulloch教授和Walter Pitts教授与1943年在论文A logical calculus of the ideas immanent in nervous activity中提出。论文中提出了一种模拟模拟大脑神经元的结构—莫克罗-彼特氏神经模型(McCUlloch-Pitts Neuron model),它是一个类似下图的结构:

人类神经元处理信号的原理到现在对我们也并没有完全清晰,所以莫克罗-彼特氏神经模型其实采用的是简单的线性加权的方式来模拟这个过程,其中I为输入,W为权重,加权的和经过一个阈值函数后作为输出。可以看到,其实这个模型和后来的神经网络里的单个神经元已经非常像了。所以这个模型性能的好坏完全由分配的权重决定,然后莫克罗-彼特氏神经模型手动分配权重的方式既麻烦又很难达到最优分类效果。

为了让计算机能够更加自动且更加合理的设置权重,Frank Rosenblatt教授于1958年提出了感知机模型(perceptron),或者叫感知器模型。感知机使用特征向量来表示的前馈式人工神经网络,它是一种二元分类器,在人工神经网络领域中,感知机也被指为单层的人工神经网络。

1969年,Marvin Minsky 和 Seymour Papert 在《Perceptrons》书中,仔细分析了以感知机为代表的单层神经网络系统的功能及局限,证明感知机不能解决简单的异或(XOR)等线性不可分问题,Marvin Minsky教授甚至做出了“基于感知机的研究注定失败”的结论。

由于 Rosenblatt 教授等人没能够及时推广感知机学习算法到多层神经网络上,又由于《Perceptrons》在研究领域中的巨大影响,及人们对书中论点的误解,造成了人工神经领域发展的长年停滞及低潮,之后的十多年内,基于神经网络的研究几乎处于停滞状态。

虽然Marvin Minsky教授的结论是神经网络在20世纪70年代低潮的原因之一,但是这不能磨灭Marvin Minsky教授对人工智做出的伟大贡献,这仅仅是认知在某个时间段为的局限性,就像“日心说”一样。

直到人们认识到多层感知机没有单层感知机固有的缺陷及反向传播算法在80年代的提出,才有所恢复。1987年,书中的错误得到了校正,并更名再版为《Perceptrons - Expanded Edition》。这也是神经网络发展的第二个阶段。

分布式表达与反向传播算法

20世纪80年代末,神经网络的研究迎来了第二次兴起,这源于分布式表达与反向传播算法的提出。

分布式知识表达的核心思想是现实世界中的知识和概念应该通过多个神经元来表达,而模型中的每一个神经元也应该参与多个概念。分布式只是表达大大加强了模型的表达能力,解决了类似异或这种线性不可分的问题。

除了分布式表达,David Everett Rumelhart教授等人于1986年在自然杂志上首次提出了著名的反向传播算法,此算法大幅降低了模型训练所需要的时间。直到今天,反向传播算法仍然是训练神经网络的主要算法。

同时,计算机的飞速发展也使得计算机有了更强的计算能力,这些因素使得神经网络在80年代末到90年代初又迎来了发展的高峰期。

然后。在神经网络发展的同时,传统的机器学习算法也取得了突破性的进展,支持向量机算法具有完整的理论基础,少样本量等优点。同时由于BP算法针对深层网络的梯度消失问题,当时的数据量太小无法支撑深层网络训练等问题。兴起了没多久的神经网络逐步被支持向量机所取代。

DNN与Deep Learning

时间进入21世纪,计算机性能进一步的提高,GPU加速技术的出现,使得计算量不再是阻碍神经网络发展的问题。与此同时,互联网+的发展,使得获取海量数据不在像上个世纪末那么困难,这些背景为神经网络再次发展提供了条件。

在这里不得不提的就是ImageNet项目的建立,斯坦福大学的李飞飞教授开启了Visual Genome(视觉基因组)计划,把语义和图像结合起来,缔造了当前世界上最大的图像数据库—ImageNet,这个庞大的数据库由来自世界上167个国家的接近5万个工作者完成,ImageNet的出现使所有人都能够轻松的获取足以支撑其深度网络训练的数据。同时斯坦福大学每年都会举行一个比赛,邀请谷歌、微软、百度等IT企业使用ImageNet数据库,而第一个应用深度神经网络的算法—Alexnet,就是ImageNet 竞赛2012年冠军,这个著名的网络结构如下图:

Alexnet取得的突破性进展使得神经网络的研究再一次达到了一个高峰,随后其他关于DNN的更复杂的结构也陆续出现,并在除了计算机视觉外的诸多其他领域内取得了优异的成绩,如语音识别,自然语言处理等等。

直到2016年,google的AlphaGo战胜了李世石,深度学习作为深层神经网络的代名词,被各行各业的人所熟知。深度学习的发展也开启了一个AI的新时代。

最后需要指出的一点是,虽然深度学习领域的研究人员相比于其他机器学习领域更多的受到大脑工作原理的启发,媒体也经常出于某种原因强调深度学习和大脑工作原理的相似性(可能这样显得更AI),但是现代深度学习的发展已经不完全是模拟人脑神经元的工作过程,或者可以说目前人类对大脑的工作机制的认知还不足以为当下的深度学习模型提供指导。(以上这段话摘录自《TensorFlow:实战Google深度学习框架》,个人感觉写的很有观点)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CVer

10月 | 机器学习Top 10 文章/教程汇总

【导读】本文由Mybridge发布,评估近1400篇机器学习文章后,挑选出上月中的机器学习Top 10的文章教程,现由专知编译如下。

783
来自专栏机器之心

前沿 | 利用遗传算法优化神经网络:Uber提出深度学习训练新方式

3296
来自专栏AI科技评论

CNCC | 李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁 | CNCC2017

AI 科技评论报道:中国计算机学会 CCF 举办的中国计算机大会CNCC 2017已于10月26日在福州市海峡国际会展中心开幕。参加会议的人数众多,主会场座无虚...

35112
来自专栏CSDN技术头条

艺术与机器学习

原文:Google Research Blog 译者:刘旭坤 去年六月发表的一篇博文中我们用可视化的方法解释了神经网络在图形分类中的工作原理。我们意外地收获了一...

1887
来自专栏专知

【博文推荐】本月机器学习Top 10 文章/教程汇总(2018.10)

【导读】本文由Mybridge发布,评估近1400篇机器学习文章后,挑选出上月中的机器学习Top 10的文章教程,现由专知编译如下。

832
来自专栏镁客网

技术 | AI研究的盲点:无解的神经网络内在逻辑

1276
来自专栏有趣的Python

TensorFlow应用实战-2- 人工智能&深度学习介绍

2- 人工智能&深度学习介绍 人工智能相关的电影 钢铁侠 终结者 机械姬 我,机器人 ? mark 人工智能之父麦卡锡给出的定义 构建智能机器,特别是智能计算机...

4036
来自专栏CSDN技术头条

2015伦敦深度学习峰会笔记:来自DeepMind、Clarifai等大神的分享

上周,我有机会参加在伦敦举行的第三届深度学习峰会,上两届分别在旧金山和波士顿举行。 深度学习峰会由 RE.WORK主办,汇集了从工业领域到学术领域不同背景的专业...

1728
来自专栏量子位

你的广告能打几分?Kaggle需求预测挑战赛冠军方案这样做丨教程

我们每天在网页上看到的各种电商广告,到底够不够吸引人?4个月前Kaggle和“俄罗斯版58同城”Avito办了个需求预测挑战赛,预测不同的广告能吸引用户多大的购...

904
来自专栏GAN&CV

如何快速进阶AI的资源

本文译自:https://towardsdatascience.com/getting-started-with-reading-deep-learning-r...

982

扫码关注云+社区