【机械蛮力和人类智能】符号主义和联接主义的魔咒

人工智能领域的主要思想流派大致可以分为符号主义和联接主义。两种方法具有完全不同的哲学观点,计算方法和适用范围。两者都有着令人叹为观止的壮丽恢弘,也都有着自身难以打破的魔咒。

联接主义的代表自然是神经网络(artifical neural nework),实质上是来自于人类大脑神经网络的计算机模拟。每个神经元细胞具有树突,轴突和细胞体。树突可以接收信号,轴突用于输出信号,不同细胞的树突和轴突之间是神经突触,不同的突触具有不同的权重。树突传入的信号强度与相应的突触权重相乘,经由细胞体设置的非线性阈值检验,触发轴突的兴奋或抑制。数目庞大的神经元连接成结构复杂的网络,从而实现灵活多样的功能。在并不久远的历史中,神经网络几经沉浮,沧海桑田。在学术界和工程界,数度一哄而上,旋即一哄而散。近些年来,依随计算能力的突飞猛进,特别是图形处理单元(GPU)的大规模普及,神经网络再度以深度学习(deep learning)的崭新姿态闪亮登场。深度学习在图像处理,模式识别等领域如狂飙突进, 一扫几乎所有经典算法,奔腾咆哮,势不可挡。一夜之间,自然语音处理和理解,人脸检测和识别都变成了现实。同时,深度学习方法深刻地转变了学术研究的范式。以前学者们所采用的观察现象,提炼规律,数学建模,模拟解析,实验检验,修正模型的研究套路被彻底颠覆,被数据科学的方法所取代:收集数据,训练网络,实验检验,加强训练。

深度学习方法具有许多其它方法无可比拟的优点。首先,深度学习的算法具有普适性。同样的训练方法可以用于不同的具体应用,例如人脸检测和语音识别都可以应用同样的训练方法,区别只在于训练数据的不同。这一点具有神经生物学的依据:MIT 的科学家将幼年猴子的视神经和听神经剪断,互换后再连接,猴子的视觉和听觉都得以正常发育。相对于传统方法,对于拓扑问题和几何问题,我们需要应用完全不同的理论和计算工具。其次,机器学习的算法本身相对简单,算法所涉及的数学理论相对初等,实现复制的难度相对较低。目前流行的观点认为对于机器学习而言,算法的优越性不再重要,真正决定性的要素是数据的庞大和完全。更为深刻之处在于:深度学习能够自动形成不同层次的概念。深度学习网络一如人类的视觉中枢是具有层次的,局部的具体特征,被底层网络所总结;全局的抽象特征,被高层网络所提取。并且,这些特征被网络以权重的形式所储存。传统方法所无法明晰表述的概念,例如不同画家的艺术风格,音乐特色等只可意会无法言传的感觉,现在可以被精确量化,并以数字的形式被识别,处理,转换和融合。人工智能的本质特征之一就是系统能够自发地形成概念。当然,深度学习方法更是具有无可比拟的实用价值,人脸识别、语音识别方面的突破更为工业商业的发展提供了难以想象的广阔空间。

机器学习的方法具有方法论上的巨大缺陷。首先,深度学习的目的是学习一个函数,或者概率分布,本质上是唯像的解释,换言之,这种方法揭示了“相关性”而非“因果性”。历史上,人类积累科学知识,在初期总是得到“经验公式”,但是最终还是寻求更为深刻本质的理解。例如从炼丹术到化学,量子力学的发展历程。其次,目前机器学习算法的空间和时间代价过大。比如我们考察人脸表情识别问题,人脸上只有几十条肌肉,加上光源变化,视角变化,所有人脸带表情的照片所形成的空间(流形)不会超过上百维。但是,所训练的神经网络往往具有数十万维。训练数据量巨大,训练周期过长。再次,目前深度学习方法的理论相对比较薄弱,算法经验性较强。参数的调节方法目前依然是一门“艺术”,而非“工艺”,算法最终收敛到局部最优。如果将机器学习算法视作蒙特卡洛方法,那么理论上它的收敛速度是低于传统方法的。深度学习方法在视觉领域无可争议地取得了令人瞩目的成功,但是动物的视觉可能比人类更为敏锐和灵活,人类智能最为独特之处在于数学推理,特别是机械定理证明,对于这一点机器学习方法是无能为力的。为此,我们必须借助于符号主义方法。

符号主义方法模仿数理科学的发展方式,将知识系统地整理成公理体系。希尔伯特学派将数学严格公理化,从公理出发,由逻辑推理得到引理,定理,推论。广义而言,将数学发现整理成一系列的逻辑代数运算,将直觉洞察替代为机械运算。在初等几何领域,机械定理证明方法取得了巨大的成功。吴文俊方法和 Groebner 基方法可以行之有效地推演出几乎所有经典欧式几何的定理。其方法大致如下:首先将输入图形的关键点建立坐标,各种已知的几何条件表示成代数方程,一般表示成关键点坐标的多项式方程,同样将结论的几何条件转化为多项式方程。那么证明定理等价于验证结论多项式在由条件多项式生成的理想之中。判定多项式属于某个理想可以用吴特征列或 Groebner 基方法来完成。和机械学习方法类似,这种机械定理证明方法将丰富多彩,千奇百怪的几何定理证明方法都转化为一种方法,因而具有极大的普适性;同时,机械定理证明可以保证推导过程中出现错误的概率极小。人们一度相信,在计算机的巨大帮助下,许多深刻的定理证明将会轻易获得。

但是,对于这种机械定理证明的方法一直具有巨大的争议。首先,公理化方法具有本质的局限性。哥德尔的工作证明了对于任何一个公理体系,总是存在一个客观真理,不被此公理体系所包含。这在某种意义上意味着人类探索自然真理的过程是无限的。对于任何一个包含算术公理体系的公理体系,总存在一个命题,它无论对错都和公理体系不发生矛盾。比如我们知道有理数有无穷多个,实数有无穷多个;有理数可以和实数的一个子集建立双射,实数无法和有理数的子集建立双射,从这个意义上而言,有理数严格少于实数。那么,是否存在一个无穷数集,它的个数严格介于有理数和实数之间(在如上的意义下)。这个问题的答案无论是有或无,对于现代数学公理体系都不发生矛盾。其次,机械定理证明方法在根本上是“证明”了定理,还是“检验”了定理?在数学历史上,对于一个著名猜想的证明和解答,答案本身并不重要,在寻找证明的过程中所凝练的概念,提出的方法,发展的理论才是真正目的所在。机械定理证明验证了命题的真伪,但是无法明确地提出新的概念和方法,实质上背离了数学的真正目的。比如,地图四色定理证明,数学家将平面图的构型分成 1936 种,然后用计算机逐一验证。在这一过程中,没有新颖概念的提出。换言之,用机械蛮力替代了几何直觉。再次,机械定理证明的前提是问题的代数化。初等几何问题必须经过坐标化,条件和结论的代数化之后,才能运用理想理论来机械证明。但是,几何问题代数化本身可能就是最为“智能”的步骤。比如微分几何,只有引人嘉当的外微分法之后才能被代数化。大量黎曼几何和低维拓扑中的命题无法被直接代数化。另外一点,算法的复杂度。希尔伯特定理是说多元多项式环中的理想都是有限生成的,这一定理保证了 Grober 基方法在有限步骤内停止。但是,这一算法在计算过程中所消耗的空间有可能是超指数膨胀,因此在现实中,对于复杂的定理,这一算法无法胜任。另外一点,机械定理证明给出的结果人类经常无法理解,从中无法直接得到启迪。迄今为止,机械定理证明方法尚未发现具有重大意义的人类未曾知道的定理。

在实际应用中,连接主义和符号主义的方法相互融合,取长补短。比如,棋类比赛本质上是一个公理系统,属于符号计算的范畴,传统上可以用逻辑推理加上空间搜索技术加以解决。由于搜索空间的指数膨胀,如何剪枝成为关键。剪枝依赖于记忆并识别一些有意义的模式,这些模式可以用深度学习的方法来获取,并且已经由帝国理工学院的团队(马修-莱)所实现,并获得成功。对于空间复杂度更高的围棋,人工智能依然无法战胜人类。我们相信,这一局面很快会被打破。

人工智能的方法日新月异,日益侵占着人类智能的领地。联接主义和符号主义的思想和方法相辅相成,各有千秋,它们在各自的领域都无可争议地取得了巨大成功。但是,机械学习的方法能否抽象出因果规律,机械定理证明方法能否发展出真正的概念定理体系,这些都是具有激烈争议的问题。联接主义和符号主义所面临的魔咒都指向同一个根本问题:机械蛮力和人类智能的本质差异究竟在哪里,人之所以为人的本质在哪里?

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-09-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【NLP2005年以来大突破】语义角色标记深度模型,准确率提升10%

【新智元导读】被称为取得了NLP “2005 年以来首个大突破”的研究报告 Deep Semantic Role Labeling: What Works an...

3103
来自专栏专知

【干货荟萃】机器学习&深度学习知识资料大全集(一)(论文/教程/代码/书籍/数据/课程等)

点击上方“专知”关注获取更多AI知识! 【导读】转载来自ty4z2008(GItHub)整理的机器学习&深度学习知识资料大全荟萃,包含各种论文、代码、视频、书籍...

5235
来自专栏计算机视觉战队

腾讯AI Lab的CVPR 2018文章解读

今天和大家分享马上要召开的CVPR 2018会议,这算殿堂级的会议,今天主要主角是我和腾讯,?说起腾讯,其实和他还有许多缘分,但是现在还挺不是个滋味,永远记得1...

831
来自专栏数据派THU

一文读懂深度学习模型近年来重要进展(附梳理图)

2016
来自专栏小樱的经验随笔

【资料分享】500篇干货解读人工智能新时代

500篇干货解读人工智能新时代 本文主要目的是为了分享一些机器学习以及深度学习的资料供大家参考学习,整理了大约500份国内外优秀的材料文章,打破一些学习人工智能...

2974
来自专栏新智元

人类将可能操控AI?神经网络语言处理工作原理被破解

作者:刘光明 【新智元导读】近期,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经通过新的解释技术,来分析神经网络做机器...

3214
来自专栏mantou大数据

[机器学习Lesson 1 Introduction] 机器学习的动机与应用

E = the experience of playing many games of checkers

38110
来自专栏新智元

【干货】人工智能与深度学习最好的入门资源(下载)

此列表包含了人工智能和深度学习最好的入门资源,对初学者和想要进入这一领域但又不知道如何开始的人最为有用。 机器学习 机器学习领域的最佳入门介绍,可以在cours...

39613
来自专栏CVer

[计算机视觉论文速递] 2018-06-06

这篇文章有4篇论文速递信息,涉及目标跟踪、GAN、Zero-Shot Learning、视频分类和行人重识别等方向(含一篇IJCAI 2018和一篇IROS 2...

592
来自专栏数学人生

用强化学习玩文本游戏

随着 DeepMind 成功地使用卷积神经网络(CNN)和强化学习来玩 Atari 游戏,AlphaGo 击败围棋职业选手李世石,强化学习已经成为了机器学习的一...

5301

扫描关注云+社区