【机械蛮力和人类智能】符号主义和联接主义的魔咒

人工智能领域的主要思想流派大致可以分为符号主义和联接主义。两种方法具有完全不同的哲学观点,计算方法和适用范围。两者都有着令人叹为观止的壮丽恢弘,也都有着自身难以打破的魔咒。

联接主义的代表自然是神经网络(artifical neural nework),实质上是来自于人类大脑神经网络的计算机模拟。每个神经元细胞具有树突,轴突和细胞体。树突可以接收信号,轴突用于输出信号,不同细胞的树突和轴突之间是神经突触,不同的突触具有不同的权重。树突传入的信号强度与相应的突触权重相乘,经由细胞体设置的非线性阈值检验,触发轴突的兴奋或抑制。数目庞大的神经元连接成结构复杂的网络,从而实现灵活多样的功能。在并不久远的历史中,神经网络几经沉浮,沧海桑田。在学术界和工程界,数度一哄而上,旋即一哄而散。近些年来,依随计算能力的突飞猛进,特别是图形处理单元(GPU)的大规模普及,神经网络再度以深度学习(deep learning)的崭新姿态闪亮登场。深度学习在图像处理,模式识别等领域如狂飙突进, 一扫几乎所有经典算法,奔腾咆哮,势不可挡。一夜之间,自然语音处理和理解,人脸检测和识别都变成了现实。同时,深度学习方法深刻地转变了学术研究的范式。以前学者们所采用的观察现象,提炼规律,数学建模,模拟解析,实验检验,修正模型的研究套路被彻底颠覆,被数据科学的方法所取代:收集数据,训练网络,实验检验,加强训练。

深度学习方法具有许多其它方法无可比拟的优点。首先,深度学习的算法具有普适性。同样的训练方法可以用于不同的具体应用,例如人脸检测和语音识别都可以应用同样的训练方法,区别只在于训练数据的不同。这一点具有神经生物学的依据:MIT 的科学家将幼年猴子的视神经和听神经剪断,互换后再连接,猴子的视觉和听觉都得以正常发育。相对于传统方法,对于拓扑问题和几何问题,我们需要应用完全不同的理论和计算工具。其次,机器学习的算法本身相对简单,算法所涉及的数学理论相对初等,实现复制的难度相对较低。目前流行的观点认为对于机器学习而言,算法的优越性不再重要,真正决定性的要素是数据的庞大和完全。更为深刻之处在于:深度学习能够自动形成不同层次的概念。深度学习网络一如人类的视觉中枢是具有层次的,局部的具体特征,被底层网络所总结;全局的抽象特征,被高层网络所提取。并且,这些特征被网络以权重的形式所储存。传统方法所无法明晰表述的概念,例如不同画家的艺术风格,音乐特色等只可意会无法言传的感觉,现在可以被精确量化,并以数字的形式被识别,处理,转换和融合。人工智能的本质特征之一就是系统能够自发地形成概念。当然,深度学习方法更是具有无可比拟的实用价值,人脸识别、语音识别方面的突破更为工业商业的发展提供了难以想象的广阔空间。

机器学习的方法具有方法论上的巨大缺陷。首先,深度学习的目的是学习一个函数,或者概率分布,本质上是唯像的解释,换言之,这种方法揭示了“相关性”而非“因果性”。历史上,人类积累科学知识,在初期总是得到“经验公式”,但是最终还是寻求更为深刻本质的理解。例如从炼丹术到化学,量子力学的发展历程。其次,目前机器学习算法的空间和时间代价过大。比如我们考察人脸表情识别问题,人脸上只有几十条肌肉,加上光源变化,视角变化,所有人脸带表情的照片所形成的空间(流形)不会超过上百维。但是,所训练的神经网络往往具有数十万维。训练数据量巨大,训练周期过长。再次,目前深度学习方法的理论相对比较薄弱,算法经验性较强。参数的调节方法目前依然是一门“艺术”,而非“工艺”,算法最终收敛到局部最优。如果将机器学习算法视作蒙特卡洛方法,那么理论上它的收敛速度是低于传统方法的。深度学习方法在视觉领域无可争议地取得了令人瞩目的成功,但是动物的视觉可能比人类更为敏锐和灵活,人类智能最为独特之处在于数学推理,特别是机械定理证明,对于这一点机器学习方法是无能为力的。为此,我们必须借助于符号主义方法。

符号主义方法模仿数理科学的发展方式,将知识系统地整理成公理体系。希尔伯特学派将数学严格公理化,从公理出发,由逻辑推理得到引理,定理,推论。广义而言,将数学发现整理成一系列的逻辑代数运算,将直觉洞察替代为机械运算。在初等几何领域,机械定理证明方法取得了巨大的成功。吴文俊方法和 Groebner 基方法可以行之有效地推演出几乎所有经典欧式几何的定理。其方法大致如下:首先将输入图形的关键点建立坐标,各种已知的几何条件表示成代数方程,一般表示成关键点坐标的多项式方程,同样将结论的几何条件转化为多项式方程。那么证明定理等价于验证结论多项式在由条件多项式生成的理想之中。判定多项式属于某个理想可以用吴特征列或 Groebner 基方法来完成。和机械学习方法类似,这种机械定理证明方法将丰富多彩,千奇百怪的几何定理证明方法都转化为一种方法,因而具有极大的普适性;同时,机械定理证明可以保证推导过程中出现错误的概率极小。人们一度相信,在计算机的巨大帮助下,许多深刻的定理证明将会轻易获得。

但是,对于这种机械定理证明的方法一直具有巨大的争议。首先,公理化方法具有本质的局限性。哥德尔的工作证明了对于任何一个公理体系,总是存在一个客观真理,不被此公理体系所包含。这在某种意义上意味着人类探索自然真理的过程是无限的。对于任何一个包含算术公理体系的公理体系,总存在一个命题,它无论对错都和公理体系不发生矛盾。比如我们知道有理数有无穷多个,实数有无穷多个;有理数可以和实数的一个子集建立双射,实数无法和有理数的子集建立双射,从这个意义上而言,有理数严格少于实数。那么,是否存在一个无穷数集,它的个数严格介于有理数和实数之间(在如上的意义下)。这个问题的答案无论是有或无,对于现代数学公理体系都不发生矛盾。其次,机械定理证明方法在根本上是“证明”了定理,还是“检验”了定理?在数学历史上,对于一个著名猜想的证明和解答,答案本身并不重要,在寻找证明的过程中所凝练的概念,提出的方法,发展的理论才是真正目的所在。机械定理证明验证了命题的真伪,但是无法明确地提出新的概念和方法,实质上背离了数学的真正目的。比如,地图四色定理证明,数学家将平面图的构型分成 1936 种,然后用计算机逐一验证。在这一过程中,没有新颖概念的提出。换言之,用机械蛮力替代了几何直觉。再次,机械定理证明的前提是问题的代数化。初等几何问题必须经过坐标化,条件和结论的代数化之后,才能运用理想理论来机械证明。但是,几何问题代数化本身可能就是最为“智能”的步骤。比如微分几何,只有引人嘉当的外微分法之后才能被代数化。大量黎曼几何和低维拓扑中的命题无法被直接代数化。另外一点,算法的复杂度。希尔伯特定理是说多元多项式环中的理想都是有限生成的,这一定理保证了 Grober 基方法在有限步骤内停止。但是,这一算法在计算过程中所消耗的空间有可能是超指数膨胀,因此在现实中,对于复杂的定理,这一算法无法胜任。另外一点,机械定理证明给出的结果人类经常无法理解,从中无法直接得到启迪。迄今为止,机械定理证明方法尚未发现具有重大意义的人类未曾知道的定理。

在实际应用中,连接主义和符号主义的方法相互融合,取长补短。比如,棋类比赛本质上是一个公理系统,属于符号计算的范畴,传统上可以用逻辑推理加上空间搜索技术加以解决。由于搜索空间的指数膨胀,如何剪枝成为关键。剪枝依赖于记忆并识别一些有意义的模式,这些模式可以用深度学习的方法来获取,并且已经由帝国理工学院的团队(马修-莱)所实现,并获得成功。对于空间复杂度更高的围棋,人工智能依然无法战胜人类。我们相信,这一局面很快会被打破。

人工智能的方法日新月异,日益侵占着人类智能的领地。联接主义和符号主义的思想和方法相辅相成,各有千秋,它们在各自的领域都无可争议地取得了巨大成功。但是,机械学习的方法能否抽象出因果规律,机械定理证明方法能否发展出真正的概念定理体系,这些都是具有激烈争议的问题。联接主义和符号主义所面临的魔咒都指向同一个根本问题:机械蛮力和人类智能的本质差异究竟在哪里,人之所以为人的本质在哪里?

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-09-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【CVPR 2018】照片闭眼也无妨,Facebook黑科技完美补全大眼睛

1143
来自专栏新智元

Facebook全新无监督机器翻译法,BLUE测试提升超过10分!

作者:Marc’aurelio Ranzato、Guillaume Lample、Myle Ott

702
来自专栏AI科技评论

UC Berkeley 讲座教授王强:Deep Learning 及 AlphaGo Zero(下)

AI 科技评论按:北京时间10月19日凌晨,DeepMind在Nature上发布论文《Mastering the game of Go without huma...

3165
来自专栏AI科技大本营的专栏

利用3D打印构建衍射深度神经网络,可光速执行数字运算

通过识别手写数字构建的人工神经网络一直以来都是重要的研究课题,手写数字往往因书写风格差异、上下文无关及识别准确度高等要求导致识别难度大,因此针对手写数字的研究有...

682
来自专栏大数据文摘

学界 | Github八月深度学习项目热搜Top 10,你Pick哪一个!

大家好!文摘菌发现了一份过去的一个月机器学习项目的Top 10,特地为大家搬运过来,看看你pick哪一个呢?

771
来自专栏机器学习算法与Python学习

AlphaGo 相关算法简单介绍

这一片将简单的介绍一些AlphaGo的相关算法,其中一些算法是之前介绍过的,未介绍过的那些将在接下来的日子详细展开*(近来有朋友问我关于最近半个...

34313
来自专栏ACM算法日常

第七篇:《机器学习之神经网络(二)》

我们之前学的,无论是线性回归还是逻辑回归都有这样一个缺点,即:当特征太多时,计算的负荷会非常大。

651
来自专栏机器学习算法与Python学习

深度学习(deep learning)发展史

源 | 小象 本文节选自人民邮电出版社最新出版的 AI 圣经《深度学习DEEP LEARNING[1]》。《深度学习DEEP LEARNING[2]》英文版由美...

3428
来自专栏用户2442861的专栏

阿尔法狗是怎么用机器学习做决策的

雷锋网注:本文作者许铁, 法国巴黎高师物理硕士 ,以色列理工大学(以色列85%科技创业人才的摇篮, 计算机科学享誉全球)计算神经科学博士,巡洋舰科技有限公司创...

451
来自专栏大数据

一位 TalkingData 员工学习人大统计学课程的笔记及感想

引言 新的一年,想必不少人都给自己树立了学习目标,要想学习上得去,先得学会做笔记。记笔记是我们在学习过程中消化总结的好方式,良好的记笔记习惯能起到事半功倍的效果...

1879

扫码关注云+社区