近日,海航科技首席科学家谢耘博士推出最新力作:《智能化未来:“暴力计算”开创的奇迹》。
在21世纪初,当那一轮互联网泡沫破灭后,人们开始认真地讨论下一轮推动社会经济发展的技术在哪里。当时被看好的是生物科技。
但世事难料。21世纪进入第二个十年,“摩尔定律”几十年的作用终于产生了质变,计算机拥有了超乎想象的“暴力计算”能力。
强大而廉价的计算能力出现在社会的各个角落。
人工智能也乘势焕发了第二春,利用“大数据”开始在许多具体应用上超越人类。
以计算机为核心的信息技术在积累了几十年之后,以“智能”为利器,终于显示出其翻天覆地的巨大能量。
这一切是如何发生的?
它背后的逻辑是什么?
智能化的信息技术的“可能”与“不可能”的边界在哪里?
人类社会将被它重塑成何种模样?
谢耘博士在新著《智能化未来:“暴力计算”开创的奇迹》一书中,帮读者层层剖析,寻找信息技术发展的规律,以及它正在对人类产生的空前的历史性影响。
上海大学计算机科学学院院长、英国帝国理工学院终身教授郭毅可在序言中写道:读罢此书,让我掩卷沉思,深深感慨。
他说谢耘像一个哲人,把计算机科学与技术的发展,置于人类文明与社会进步的大格局下来思考、探索其对人类未来的影响和自身的进化逻辑。这本书可以说是谢耘的一本思想的笔记。
思想的笔记要写好不容易。谢耘这本思想笔记,有以下几大特征:
首先,可以表达的思想必须要有内容,而内容来自知识与经历。谢耘科班出身,实战于中国IT发展的第一线,从业于IT界数十年,是中国IT排头企业的技术领军人物。
其次,一个好的思想笔记还要有高度的抽象与总结,这又是这本书的一个特色。
第三,有活力的思想必须具有批判性。在本书中,批判的思辨又是一个鲜明的特征。
最后,一种吸引人的思想是要有情怀的。作者有对人类的情怀,也有对民族的情怀。情怀不仅仅是产生思想的主观动力,也是思想得以传播的介质。
而谢耘在后记中写道:
如果命运注定中华民族将再次复兴的话,我们就需要超越西方的语言与思维框架。
西方讲究逻辑与实证,习惯抓住一点而不顾其余;中国长于宏观思考与对本质的感悟,但往往止于大概,失于严谨。
超越“东”“西”,中国信息技术产业才有可能独树一帜,乃至引领大潮;
超越“东”“西”,中华民族才有可能实现百年复兴之梦,开创人类文明史上的一个新纪元;
超越“东”“西”,智能化的信息文明才能为人类开创出一个繁荣、祥和、共存并充满希望的未来。
章节节选
第8章
系统级创新引领智能化的未来
前文从信息技术产业发展的宏观视角开始,从历史中寻找信息技术产业发展的本质规律;随后逐步深入到信息技术的最底层,去追寻其微观基础“信息”的本质;继而一层层向上阐述了产业“中观”层面的、面向未来的以主体虚拟映像为基础的智能化融合服务模式。在这个过程中,还结合信息技术产业的发展,从不同的角度对“创新”进行了深入分析。本章再回到宏观的视角,回到信息技术产业的DNA本质—“智能”上面。
针对“人工智能”众说纷纭的前景,审视一下最本质的问题:智能是什么。然后结合前面章节对信息技术应用未来发展的分析及对人工智能曾经走过的道路的回顾,将从信息技术产业的技术结构分析“人工智能”技术的真实地位,以及信息技术“智能”的一般性表现形态“机器智能”,探讨未来信息技术智能化应用核心的创新将会呈现在哪一个层面,以及带来的长远影响。
本章将指出,在这个过程中,系统级创新在未来将具有超越具体技术进步的决定性的意义,“机器智能”才是信息技术对人类智能的辅助与延伸作用的未来体现形式。
8.1 人类“智能”的本质:无中生有的自觉与主动
人工智能领域的大师级人物H.A.Simon在1957年说的一段话曾经被不断地引用:“我的目标不是使你惊讶或者震惊—我能概括的最简单的方式是说现在世界上就有机器能思考、学习和创造。而且它们做这些事情的能力将快速增长直到—可见的未来—它们能处理的问题范围扩展到人类思想已经得到应用的范围。”这段话表达了在人工智能起步的时候,人们对智能类工具的期待就是造出一个完整的、独立的、与人相当的智能化机器,也许它长得与人并不相像。
那么,“智能”到底是什么?对此学术界至今也没有给出一个标准的答案。在第1章第1.5节中也回避了这个问题,而仅仅从计算机的本质出发,分析了什么样的智能“活动”是计算机可实现的。下面通过对人的智能活动的分析来深入地探讨一下人类智能的本质特征,即使我们难以给智能下一个准确的定义。
智能显然是深藏在人(或其他生命)的大脑中的一种能力。不考虑宗教的说法,从科学的角度来看,人在出生之时,除本能以外,就知识与具体的能力而言,大脑是一片空白。然后随着一天天成长,通过、而且仅仅通过与外界的交互,人就能逐步获得越来越多的知识与能力,学会说话、走路、唱歌、写字、分析、思考等。人的智力随之不断增长,进而成为一个有健全智能的人。
这个过程与现代计算机实现的人工智能是有本质不同的。计算机实现的高级智能目前都是与领域相关的,虽然也包括一定程度的“自学习”过程,但是这些智能的基础还是大量人工直接“植入”的与领域相关的知识与能力,如针对领域中各种具体问题的算法等。而人的成长却完全不同,人仅仅依靠与外界的交互就可以获得各种高级且复杂的、与不同领域相关的能力与知识,而无须打开大脑对大脑神经元进行底层“编程”或“设置”。
显然,在人的大脑中,与生俱来就拥有了某种初始内在底层的“智慧能力”,这种能力与具体的领域知识技能无关,是一种高度抽象的能力。它让人从一片空白的无知逐步获得各种不同意义的具体的智能,包括具象的情感与抽象的逻辑认知能力。我们可以认为人具有的这种初始能力也是被“植入”的。但是它与计算机被植入的与领域相关的能力却有本质不同,这种智能在本质上与知识经验等无关,是通过与外界的交互而获得知识与经验的基础性能力。而在此基础上的“智能活动”,则是智能发挥作用的过程,也就是人思考的意识过程。如果这个过程是可以逻辑化描述的,则就能够物化为机器的行为,实现对人脑的思维机制模拟,否则就只能寻找别的方法去做机制替代(见第1章第1.5节)。
为了方便,我们把人所具有的这种高度抽象的、与领域无关的基础性智能称之为“基础核心智能”。它不仅仅是一般意义上的智能的基础,也是人的自觉性与主动性的来源。基础核心智能与其他智能及智能活动之间的关系如图8-1所示。
图8-1 人的智能层次示意图
对于这种基础核心智能到底是什么,我们显然知之甚少,如果不是一无所知的话。也许就像人无法揪着自己的头发将自己从地上拔起那样,这种基础核心智能也许是人自己的智能自身所永远无法认识的黑洞。如果我们不能够理解这种基础核心智能,谈论人工智能对人的完整模拟乃至超越就显得依据不足。当年那些科学家们信誓旦旦声称在10~20年内就可以造出拥有与人同样智能的机器,显然是认为我们可以掌握这种“基础核心智能”,然后将其“植入”到计算机中,从而实现完整的人工智能。
在人工智能兴起的初期,那些抽象的、与领域无关的逻辑规则,如推理、归纳等,就被认为是“基本核心智能”。但后来的实践证明虽然这些能力确实也具有与领域无关的特质,并且也许确实与“基本核心智能”相关,但远不是“基本核心智能”的关键或全部。
实现完整的、与人相当的人工智能这个梦想,至今依然非常遥远。能够战胜国际象棋世界冠军的深蓝,也只是具有特定领域内的“智能”,而不具有“基础核心智能”。所以如果它还“想”下围棋的话,它没有办法自己去学习,而是要由人再另行“植入”一套下围棋的知识与能力,那才会成为后来的AlphaGo了。
我们不知道如何描述这种“基础核心智能”,也不知道这种“基础核心智能”是否是基于“数值计算”的,或是否可以用某种算法来表达。当然,许多人相信人的智能的基础是可以用数值计算来完成的,这种信念可以追溯到古希腊时期的毕达格拉斯(约公元前580年—前500年,古希腊哲学家、数学家和音乐理论家)。他在两千多年前就坚信“万物皆数”,认为这个世界的一切问题都可以归结为数字计算问题。虽然许多智能活动属于计算问题,虽然今天用计算的方法实现了越来越多的智能类活动,但依然没有足够的证据证明人类智能的基础就是数值计算,也还没有充分的理论或实践证据证明可以用数值计算来直接完整地模拟人类的智能过程。
所以,认为用数值计算可以直接完整地实现人所拥有的智能,甚至可以超越人类的智能,更多的是一种信念,而非被理论或实践证明了的科学意义上的结论。
当然,还有人认为人脑的这类智能过程是量子过程。但是量子计算到今天还是仅仅去做一些数值算法,而没有找到其他的与人的底层智能契合的、在数值逻辑计算之外的基本机制(见第1章第1.3节)。
图8-2 大脑的不同区域(陶然提供)
我们对大脑内在机制的知识缺失还不仅仅限于此。
神经生理学家经过近百年的努力,已经可以将大脑的不同部位与不同的功能对应起来(见图8-2)。枕叶主要负责视觉加工,躯体感觉联合区接收多通道感觉信息并进行整合,顶叶主要进行感觉加工,颞叶负责语言、听觉加工,运动功能区支配肌肉、眼球等的运动,而额叶既负责推理、决策等高级认知加工过程,也是掌管人格的区域。并且,越来越多的研究发现,人类的任何一项认知加工都不仅依赖于某一侧脑区,而是由左右两侧大脑共同协作完成的,但对于特定加工会有单侧化优势(hemisphere advantage),即主要依赖于左侧半球或右侧半球来完成任务。
大脑的运动功能区左右分别交叉控制着人体的右左侧,这是两侧大脑最明显的一个分工。但是事情远非这样简单。尽管正常情况下各脑区分工明确,但我们的大脑还具有强大的动态调整能力,即可塑性。这种能力强大到了令人瞠目的地步。
2009年2月,中国中央电视台CCTV-10科教频道《科学探索》节目讲述了一个“半脑人”的故事。这个病人在刚出生不久就发高烧而被诊断为脑膜炎,当时医生认为他会有后遗症。但是他的病症不久就消失了,没有发现异常而一直健康成长。到了12岁的时候,他出现了癫痫症状。随后,癫痫发作间隔逐年缩短。在他17岁时,癫痫发作间隔已经按星期来算了,家人只好带他到武汉的大医院诊治。图8-3是他的脑部CT片,从中能够看到他的一侧大脑严重病变萎缩。
图8-3 一侧严重萎缩了的大脑
医生看到这种情况,决定摘除已经丧失了基本功能并且严重萎缩的一侧大脑。手术后,病人的癫痫症状彻底消失,而且各种表现也一如常人。医生推断,在他小时候那次得病之后,一侧大脑就逐渐失去作用,另一侧逐步完整地接管了大脑的所有功能。这个例子似乎支持了人的大脑在正常情况下利用率不高这一结论,虽然对此结论尚有争议。
可能是因为这个病例在普通人眼里有点儿“不科学”,所以《科学探索》节目特别做了连续三期的报道。其实在世界上,这种“半脑人”并非绝无仅有。从这些半脑人身上,我们看到大脑具有高度的动态自我调整能力,生理学称代偿作用。病变的脑区所应负责的功能由剩余部分的大脑建立新的神经通路与神经联结来承担。这种能力与现在风起云涌的、可以动态配置资源的云计算分布式系统有着某种类似的地方。
下面把人脑与云计算分布式计算机系统作一下对比(见图8-4)。我们知道,在人的大脑底层,有海量的神经元连接在一起的大脑神经网络,每个神经元相当于一个处理单元,尽管我们不清楚在神经元内部发生的物理与生化过程是否可以被解释为数值计算过程。神经生理学家还告诉我们许多不同部位的神经元在控制着我们的某些活动。
图8-4 人脑与云计算分布式计算机系统的对比(1)
心理学家分析的重点则是大脑外在的、可观察、可度量的各种意识行为表现。这些表象相当于大脑的各种具体应用,对应于云计算平台之上的各种具体应用。
在云计算系统中,在基础的计算、存储和网络之上,有一个动态配置管理这些资源的云平台,或称之为云中心操作系统。这个平台处于基础计算能力与具体的应用之间,从应用层面看,它隐藏在应用之下。正是这一层的存在,使得云计算分布式系统具有了高度的动态自我调整能力。
从半脑人身上能够看到,大脑在神经网络与大脑的意识/智能活动之间,应该也有一层类似云平台的功能,负责神经元网络的形成与动态调整,它不属于人的意识活动层面的功能。而现在我们对大脑的这一层的存在形式与作用机制几乎一无所知。
简而言之,我们迄今积累了丰富的心理学知识,对大脑在应用层面的表现即“智能类活动”有着比较深入全面的理解;我们也知道大脑由众多的神经元连接而成,并且知道在正常的情况下,不同的区域主管着哪些活动。但是我们不知道神经元内部过程的智能意义,也不知道这些神经元动态组织的机制。所以,我们对人类外在的上层智能活动有了相当多的了解,据此可以做出深蓝、AlphaGo那样的系统战胜人类,但是我们对大脑的本质,对智能的底层机制和过程,包括“基本核心智能”,如果不是一无所知的话,也只能说知之甚少。
尽管如此,我们还是可以努力地将人的智能的特质做一个深入的分析描述。就个人而言,我们是从一无所知的状态,通过他人的帮助教育和自己的探索而逐步具有了各种不同的智力能力。在这其中,自己主动的探索又最为重要,因为它可以突破别人的帮助的边界,而认识新的未知,抽象形成新的知识。如果我们把视野扩展到整个人类文明,就更能看出自主探索能力的重要性了。
抛开宗教的观点,我们从科学的角度来看,人类从茫然无知、一片空白的原始状态走向智慧文明,并没有外来智慧的“引导”,而是完全依靠自己的力量,依靠自己与生俱来的“基本核心智能”去发现世界,认识世界,并且改造世界,而且目前还看不到人类智能这种不断拓展能力的失效边界。这种自觉的主动性就是人类智能的最本质的特质,应该属于“基本核心智能”的基础,是其最重要的组成部分。
目前,任何人工智能系统都还不具有这种特质。人工系统需要外来的、人的智慧的植入,并且只能在人的智慧植入的范畴内,实现与人类相比非常有限的“自我学习”,远不具有探索全新未知的能力。其根本原因就在于被植入的人的智慧仅仅是人的表层智慧能力,而不是人所具有的底层根本性的智慧机制。随着人工智能的发展,虽然我们对表层能力的理解与物化更加有效,但对深层机制的认识却依然举步维艰。
近百年来,对人工智能的追求正是在这种状态下艰难前行的。
上下滑动,查看更多内容
8.2 人工智能从理想到现实
我们再次将目光投向历史,看看“人工智能”从诞生到现在走过了怎样一条路。
在第1章第1.5节中曾经指出,在人工智能诞生之后,人工智能的发展有两个不同的方向。一种是以联结主义/人工神经网络为代表的,依靠缺少内在神似的外在形式上的模仿来实现人工智能;另外一种则是采用某种机制去实现智能化的功能。由于第一种方法没有取得明显的效果,而退化为第二种方法中的一个组成部分,所以下面集中讨论人工智能的机制实现方法。
在用机制实现人工智能的过程中,还可以细分为两个不同的途径,一种就是遵循人类思维过程,然后在通用计算机上加以复现。在这种途径中,人类和机器在解决问题的时候采用的是同样的方法。我们把这种思路称之为“机制模仿”(Mechanism Imitation)方法;而另一种思路也是成功的人工智能应用大多采用的方式,就是用完全不同的机制(或者说我们不清楚它是否与人脑内部的机制相吻合),来完成某项人类的智能活动。我们把这种思路称之为“机制替代”(Mechanism Replacement)方法。
不论是采用机制模仿还是机制替代的方式实现智能,大都走了一条相似的路:试图用一些基本的逻辑推理规则构造出具有完整智能的机器,至少能够完整地解决一类问题。从科学史的角度来看,这就是我们在第1章第1.6节中讨论过的:“寻找精巧、简洁、普适性的数学方程或系统模型去解决问题,成为科学技术领域无须讨论的基本共识。”
在传统力学领域,不论是牛顿力学还是爱因斯坦的相对论,只需要几条基本的定律就能解释几乎所有的(宏观)力学现象。所以,当初人们试图用一些基本的逻辑化推理机制就能实现复杂的智能活动是一种合乎情理的期待。
从对人的智能过程的理解角度来看,这种做法也无可厚非。在第8.1节中我们推断,人脑确实存在一些与领域无关的抽象的“基础核心智能”机制,使得我们可以以此为基础从零开始不断学习开拓。日本第五代计算机便是这种努力的典型代表。但是我们并不理解大脑的这些机制到底是什么。经过几十年的尝试,以日本第五代计算机的失败为标志,说明这种方法有着致命的缺陷。
这种方法不仅仅无法实现一般性的完整智能,即便在特定领域解决比较复杂的智能化问题,它也不能让人满意。这方面的一个典型例子就是机器翻译。人们在开始的时候,就是期望将语法规则完整地表达出来,然后加上对词汇和语义的理解,就能够造出一个良好运转的机器翻译系统。但是,现实无情地打破了这种期待。事实上,哪怕是在一个特定的领域内,我们所面对的智能问题也是相当“复杂”的。相比之下,以力学为代表的绝大多数“经典”科学所处理的问题,则显得相当“简单”。
人们经过多年的探索,终于发现在大多数的“智能”问题领域,普适的一般性逻辑化推理规则或机制,以及领域内少量的逻辑化推理规则或机制都不是解决问题的充分条件。我们必须把人在具体领域内积累的经验或知识融入进来,才有可能比较满意地解决复杂的问题。而经验和知识与一般性逻辑化推理规则或机制之间本质的区别就在于经验和知识是局限于某些特定的场合或具体领域的,而一般性逻辑化推理规则或机制具有跨领域的普适性,可以适用于广泛的不同领域。我们在第1章第1.1节最后引用的钟义信老师提出的“人类智能系统的基本模型”(图1-3),就反映了信息及知识在人类智能过程中所起的重要作用。
充分利用人的经验与知识来解决复杂性问题的典型做法就是在20世纪七八十年代蓬勃兴起的各种“专家系统”,见图8-5。这些专家系统都是针对特定领域中的一些特定问题的,融入了大量领域专家的知识和经验。在这种系统中,专家的知识与经验比普适的一般性逻辑化推理规则或机制更重要。在专家系统的发展历程中,一个标志性事件是1977年斯坦福大学的费根鲍姆在第五届国际人工智能大会上提出了“知识工程”的概念。它标志着AI研究从传统的以推理为中心进入以知识为中心的新阶段。
图8-5 专家系统示意图
当人们意识到自己没有能力用一些普适的基本逻辑化推理规则或机制去有效地解决各种“智能问题”时,人工智能的研究便扎入各种具体的问题之中。针对不同类型的问题发展出花样繁多的解决方法,也取得了很大的进展。当然,受计算机形式化方法的影响,这其中也有很多形式大于内容的产物。
人工智能发展出来的这些方法所针对的问题包括问题求解、搜索、规划、机器学习、知识表示、模式识别、自然语言处理、机器感知、数据挖掘等众多性质各异的主题。这些进展使得大量的计算机应用的智能化程度都今非昔比了。
也正因为如此,人工智能目前更多地被当成将一些具体的应用工具方法融入不同类型的应用之中,以自己具体的技术性名称出现,默默无闻地发挥着自己的作用。这些年关于人工智能的一本经典的教科书是《Artificial Intelligence:A Modern Approach》[1],它的副标题“A Modern Approach”就是指试图采用“智能体”(Agent)的概念将人工智能在各个不同领域中的方法整合到一个统一的框架之中。
在这个过程中,“人工智能”与“非人工智能”之间的界限也越来越模糊,比如用一些传统的统计方法对数据进行处理,也被纳入“智能”的范畴。其实这就反映出信息技术从一开始就是辅助与延伸人类智能的工具这一本质。“人工智能”到底该如何定义似乎更加困难了。当我们用信息技术去解决具体问题的时候,我们讲哪个技术是“人工智能”技术、哪个技术不是人工智能技术已经没有什么技术意义了。
不过,从被归入人工智能类的方法中能够清晰地看出,被冠以“人工智能”的方法都是用来处理“复杂”问题的。所谓“复杂”问题,并没有一个严格的定义,通常是指无法用一些“简单”“常规”方法来解决的问题。
时至今日,随着信息技术产业发展催生的大数据现象的到来,人们对人工智能追求的热望再次被点燃,以至于像物理学家S·W·霍金 (1942—2018,物理学家,英国剑桥大学)这样的知名人士,都对人工智能的研究发出了警告,更有人预测机器智能很快会达到失控的程度,以至于出现了“奇点临近”这样耸人听闻的说法[2]。抛开这些对未来科幻式想象不谈,智能类的方法确实再次发生了变化,沿着固有的逻辑向前迈出了新的一步。
今天在被归入智能范畴的“大数据”应用中,人们不如人工智能开创时期那样关注对基本的普适智能机制的探索,也不像专家系统那样努力地从数据中去发现基于因果关系的领域知识来指导我们解决复杂的问题,而是利用各种现成的方法,在浩如烟海的“大数据”中去发现统计“相关性”,而在一定程度上解决不同的具体问题。“深度学习”在本质上也是基于大数据的统计方法。
“因果关系”与“相关性”不是处于同一个层面的事物之间的联系。因果关系更为本质,体现了事物之间的相互作用;而相关性仅仅是表层的现象,甚至可能是假象。通过数据统计可以发现相关性,但是却很难用简单的统计来发现因果关系。因果关系需要对事物之间的作用机制进行深入的分析才能确定。
“不问因果,只关注相关”,成为大数据应用的一个理直气壮的原则。站在传统的科学理念的高度,这是从探索内在规律向表象归纳的倒退,是由“深刻”向“肤浅”的退化。但从现实的角度来看,这种做法却也不无合理及有效之处。虽然大数据应用中并没有新的原理性机制或算法的发现,利用的都是已有的成果或它们的改进,但是由于获得了前所未有的数据,拥有了前所未有的“暴力计算”能力,因此这些成熟的、甚至是陈旧的、可以追溯到牛顿时代的算法,也产生了前所未有的效果,解决了人类从未能解决的问题。这就是大数据所采取只关注相关性的做法的合理性所在。但是,我们也不应该因此就无限地夸大这种做法的意义,而认为我们在追寻智能的本质上有了新的革命性突破。这也是有学者对“深度学习”提出质疑的原因。
所以,之所以能够用“大数据”的“方法”来解决以前无法解决的问题,并不是因为我们发明了前所未知的新的方法或机制,而是因为今天计算机的能力发展到了在绝大多数情况下不再成为应用瓶颈这个历史性转折点,从而使得我们有了现实可行的技术手段获取足够多的数据,拥有了足够强大的计算能力,来用早就知道的方法,甚至是一些“低级”与“简单”的方法,去解决以前无法解决的问题。今天使用的很多方法当初被认为并非有多么高深和有效,但是借助计算机充沛的处理能力以及获取的丰富数据,这些方法在今天可以产生更加有效的结果。这也是今天计算机应用水平普遍持续提高的一个最重要的因素,这背后的动力源泉就是计算机的处理能力,以及存储能力与通信能力的持续提高。
在某种意义上来讲,以计算机为代表的信息技术确实有一种强大的、不可思议的“化平庸为神奇”的力量。只要计算能力足够强大,无须原理上的突破,用那些看上去平淡无奇、甚至相当笨拙的方法就能够创造前所未有的奇迹。我们可以形象地将这种奇迹称之为“暴力计算”的成就。这就是信息技术产业蓬勃发展的最重要的真相之一。这同时也是今天在信息技术产业中时常会出现一些缺少科学常识、似是而非的说法的原因。
如在第1章第1.6节中讨论的,信息技术这种“化平庸为神奇”的本事,就是源于计算机生而固有的唯一能力—“数值计算”。只是在计算机获得“暴力计算”能力之前,我们没有意识到信息技术使用的“低级”“粗暴”的计算方法应用可以如此广泛、有效。毕达格拉斯在两千多年前认为这个世界的一切都是计算问题这一断言,今天看起来“几乎”是“绝对真理”了。
与此相对应的是,虽然计算机的能力空前强大,但我们依然没有能够借助它去解决智能的基本机制问题。当然,它或许确实就不是一个能够通过计算来解决的问题。
从主流上看,人工智能从当初对智能基本机制的探究以期一劳永逸地整体性解决智能问题,到利用人的知识与经验解决具体领域中的复杂问题的专家系统,再到今天在充沛的计算能力基础上,利用大量的数据及已有的各种成熟算法和工具及它们的改进,以人类的知识与经验为基础更多地依赖统计性分析去解决具体的问题。这是一个从理想不断回归现实的过程。在这条发展道路上,我们能够看到两条有趣的、站在“传统”科学的立场上看似矛盾的线索。
一条线索,就是在对智能本质规律的探索上不断退化,从对基本智能机制的探究到对因果性领域知识的利用,再到对数据进行统计性相关分析,实现智能的方法一步步地在趋向“肤浅化”。在这个过程中,我们从对一般性机制的一往情深,逐步转向对知识、经验、数据等信息的日益依赖,不断地把更多的知识、经验、信息融入解决问题的方法中;另外一条线索,则是依赖于计算机日益强大的数值计算能力,“智能化”应用范围不断扩大,解决的问题不断增多,计算机因此看上去越来越“聪明”,越来越强大,对人的帮助也越来越大,见图8-6。
图8-6 人工智能从理想到现实的演化
今天,人工智能的含义已经十分模糊,大量的当初不被认为是人工智能的技术与方法都被纳入这个概念之下,而大数据从一开始就是一个模糊的、非技术性的概念,这两者也已经难以分割。随着这些技术被广泛地使用,已经很难说哪个应用不含有人工智能的技术了。其实,从一般的智能意义上来讲,计算机最初实现的数值计算应用也应该属于“智能”应用,因为计算就是人所特有的智能的一种表现。而基于计算,利用人的意识产物所做的各种应用,就更应该属于“智能”应用了(见第4章第4.1节)。所以,计算机应用从一开始就是智能化的应用,只是随着技术的进步,智能化程度在不断地提高。正因为如此,我们在第1章第1.1节就指出,计算机的出现是人类工具的一次实质性跨越,人类从此拥有了辅助与延伸智能的工具。而且如前面所分析的,在实现一般性人的智能的路一直没有走通的情况下,迄今为止,它还没有能够摆脱这样的附属性命运。
在此需要追问的是:计算机这种变得越来越强大、越来越“聪明”的趋势,在本质上意味着什么?众多新的智能化应用功能的累加能否产生质变性突破,弥补在智能本质探索上的退化而达到最终全面实现一般智能的目标?还是它难逃宿命,始终只是作为人类一个越来越好用的辅助性工具而存在?
虽然这是一个最终需要用实践来检验的问题,但是理论分析对未来还是有一定的指导意义,也远比浪漫的想象更加可靠。
按照人工智能目前的发展趋势,我们可以设想不久就能够不断地将基于不同方法策略的各种智能化应用集成在一起,从而获得一台功能日益强大的智能化机器。我们可以预测,当集成的功能足够多,它的综合能力完全可能超过某些甚至是很多普通人。那么是否可以说我们已经造出了拥有与人一样智能水平的机器?
如前所述,计算机的各种智能应用都是借助了人在相应领域中的经验与知识加上相应的逻辑化机制而实现的。这些功能即使具有有限的“学习”能力,也无法在根本上超越人工植入的领域经验与知识的局限。所以,当我们能够把大量的智能化应用集成在一起时,系统固然可以覆盖更广泛的领域,在这些领域中的表现也完全可能远超一般的人、甚至是顶尖的人,就像“深蓝”与AlphaGo那样。但是它却依然不具有主动探索未知的能力,更不要说自我意识的自觉性了。而这种能力的缺失,在根本上是因为系统只是在相对表层集成了人在某些领域中的智能或智能的产物,而缺少人所具有的、在底层与领域无关的“基本核心智能”。
现在人工智能领域的一些学者认为他们已经可以不需要预制人的知识经验,依靠计算机的“强化自主学习”就能够从数据中“自我”学习积累从而完成复杂的任务。比如谷歌旗下开发出下围棋程序的DeepMind团队就在其2017年发表于著名杂志《Nature》的论文中声称,在新的AlphaGo Zero中,没预制先验知识,它是靠自己学会下围棋的。他们说:AlphaGo Zero说明“一种纯强化学习方法是可行的,即使在最具挑战性的领域,它也能训练到超过人类的水平,并且无须人类的案例和指导。除了基本规则外,没有任何领域的基础知识。”他们的说法是“starting tabula rasa”,即从一片空白开始。
但是针对这个说法,Gary Marcus(1970—,心理认知学家,纽约大学任职)指出:“我认为这些说法是夸大其词的……他们系统中的很多方面延续了之前在围棋程序上积累的研究,比如构建游戏程序中常用的蒙特卡洛树搜索。这种技术可以用来评估动作和对策,在树状结构上快速得到测试结果。问题来了,蒙特卡洛树这种结构不是通过强化学习从数据中学习的。相反,它在DeepMind的程序中是与生俱来的,根深蒂固地存在于每个迭代的AlphaStar(注:这个词是Marcus用来指DeepMind开发出来的AlphaGo系列下围棋程序)。……可以发现,DeepMind给出的卷积结构很精确,有很多下围棋的精确参数在里面,这不是通过纯碎的强化学习学到的。……并且,(人为预制的那些)固有算法和知识的整合的取样机制不在AlphaZero的下棋学习实验中,因为那样做可能会导致模型效果变差。……与其说AlphaGo是从白板开始学习,不如说它在构建的开始就站在了巨人的肩膀上。”[3]
DeepMind团队可能自己都没有意识到自己设计的程序算法中暗藏了多少人类在围棋方面的知识与经验。
没有类似于人所具有的“基本核心智能”作为支撑,智能化的机器恐怕就只能是被动地附属于人的辅助与延伸智能类工具,而不能成为独立的智能主体,哪怕它通过了著名的“图灵测试”,哪怕它在众多的领域比很多人都更“聪明”,更“优秀”。
当然,这种“基本核心智能”的来源可以有两个。一个就是将人脑研究清楚而“复制”人所具有的这个能力;另一个可能的来源就是抛开人脑,独立创造出一套这样的“基本核心智能”,然后从理论与实践上证明基于它能够构造出一个智能系统,达到人的智能水平—可以自我学习(starting tabula rasa)。显然,目前对于这两条路我们都还没有找到它们的起点在哪里。
在2005年,瑞士的洛桑联邦理工学院与IBM一起发起了由欧盟支持的“蓝脑计划”(The Blue Brain Project,见图8-7)。该计划由科学家亨利·马克拉姆领导,准备走一条与上述各种基于对应或相当于人脑的高层意识层面活动的计算机算法及知识、数据等来实现人工智能完全不同的路。他们利用海量的计算能力,基于计算机模拟技术,用对应于人脑的基础性物质层面活动的算法去模拟人脑内部的物理生化过程。该项目计划在2023年左右实现在分子水平上对人脑的完整模拟。其直接目的是研究阿尔茨海默氏症和帕金森氏症的发病机制及治疗方法。
图8-7 蓝脑计划官方网站首页
在经过几十年艰苦努力依然无法破解人类智能本质的情况下,许多从事人工智能研究的学者对该计划抱有很大的希望。它采用的方法可以看作是一种比联结主义/人工神经网络更为彻底的对大脑在形式上的模拟。如果这种彻底的模拟成功了,就达到了神似的程度,而可以认为是一种对人脑的机制模拟了,只是其模拟的机制不是在高层意识层面的活动,而是基于底层物质层面的作用。如果成功,我们就可以在不了解人类智能本质的情况下用非生物的方法人工再现人类智能。
这种做法相当于在没有足够的空气动力学知识的情况下,完全依靠模仿鸟的各种动作而实现飞行。虽然在人类历史上鲜有类似的成功案例,但也不能认为这种做法全无成功可能,特别是在计算机获得了空前的处理能力的今天。比如,我们已经能够借助计算机强大的处理能力,结合先进的材料制造采用与鸟一样的方式飞行的机器了(见图8-8)。达·芬奇五百年前如鸟一样飞翔的梦想,今天借助强大的信息技术终于得以实现。当然,这个机器鸟的设计除了简单地模仿鸟类,还是基于空气动力学知识的。
图8-8 德国Festo公司于2011年研制出的仿生人工机器鸟
当然,要通过对大脑底层物质过程的模拟实现全面的人工智能的目标,必须跨越两个巨大的障碍。一是对人脑内部的物理生化过程有完整的理解;二是能够将人的意识活动与大脑的物理生化过程完整地对应起来。虽然在这两个方面取得了许多进展,但是离完整的把握还有非常遥远的路程。对于一个非常简单的、只有302个神经元的低级生物秀丽隐杆线虫,在清楚这些神经元之间连接关系的情况下,还无法解释它最基本的生存行为(如进食等)是如何产生的[4],而人的大脑保守估计也要有150亿个神经元。所以从目前对大脑的认识水平来看,如果蓝脑计划是一条可行的、通向完整人工智能的道路的话,目标的实现很可能要用百年的尺度来计算。事实上,欧盟支持的这个蓝脑计划在2016年被发现有严重问题,项目负责人被撤换,并且实质性地改变了项目方向与目标。
自人工智能的研究于1956年正式开始之后,我们一直希望能够造出一台与人相当的智能化的机器,它有能力来解决各种复杂性的问题。时至今日,我们发现虽然取得了巨大的进步,但依然只是找到了越来越多处理复杂具体问题的方法。这些方法被用在不同的场合,而我们依然无法基于它们构建一个能够灵活应对不同复杂问题的、拥有完整意义智能的系统。
计算机“修炼成精”是尚未找到有效途径,还是遥遥无期的事,虽然它是很多人的梦想乃至信仰。对此,我们不必杞人忧天。
也许,我们原本的期望就有不合理之处。面对未来,我们更应该关注的不是不能做什么,而是能够做什么,也许应该换一个思路从更为现实的角度来重新审视一下:应该如何有效地利用各种具体的智能类方法构建更加强大的服务于人类的智能系统。为此,首先需要把各种智能类方法放到科学、技术与应用系统的整体框架中,分析它们实际的地位,从而把握它们的本质。
领取专属 10元无门槛券
私享最新 技术干货