从古代神话到现代科幻小说,人类数千年来一直梦想着创造人工智能。但是,人工智能的发展直到20世纪50年代末才真正开始。当时,十几位科学家聚集在新罕布什尔州的达特茅斯学院,参加了一个为期两个月的研讨会,目的是创造出能够使用语言、形成抽象概念、解决目前人类面临的各种问题、并能自我提升的机器。
这次研讨会标志着人工智能的历史正式开始。但是,随着两个月的努力(以及随后的许多其他努力)证明了人类智能非常复杂,当尝试复制时,这种复杂性会变得更加明显。
这就是为什么,尽管经过了60年的研发,我们仍然没有达到能与人类儿童的认知能力相匹敌的人工智能,更不用说能像成年人一样思考的人工智能了。然而,我们所拥有的是一个科学领域,它被分为两个不同的类别:我们今天拥有的人工窄智能(ANI)和我们希望实现的人工通用智能(AGI)。
AGI有什么要求?
定义人工智能非常困难。“通用”已经意味着它是一个非常宽泛的术语,即使我们将人类智能视为基线,也并非所有人类都具有同等的智能。
但是,通用智能的系统应该具有一些特征,例如常识,背景知识,迁移学习,抽象和因果关系。这些是您从小就在全人类中看到的特征。
了解通用AI系统可以做什么的最好方法是提出一些挑战:
挑战1:在棒球比赛中,如果你把运动员的击球过程中的球棒从场景中移走,球的运动轨迹会发生什么改变?
这是一项挑战,要求AI必须了解物理动力学和因果关系。它应该能够进行反事实推理,即对场景进行更改后,在其他场景内会发生什么。
挑战2:请考虑以下内容,这是Gary Marcus和Ernest Davis在《重启人工智能》中提到的:“ Elsie试图通过电话联系她的姨妈,但她没有接听。”现在回答以下问题:
谁没有接电话?
Elsie和她的姨妈在同一个房间吗?
这个挑战要求AI具有有关电话对话的基本背景知识。大多数人都知道远程通信和电话是如何工作的,因此他们可以推断出句子中很多省略的东西,以及其指代的对象,比如代词she的先行词是谁。
挑战3:进入一个随机的房子,煮一杯咖啡。加入一些牛奶和糖。
这一挑战将要求AI对房屋的结构有一个总体的了解。它应该具有以下基本知识:食物通常在厨房里找到。咖啡储存在橱柜中。牛奶必须保存在冰箱中。人工智能必须找到咖啡机,如果没有咖啡机,它必须能够自己动手解决。大多数人下意识地解决了这些以及其他许多问题。
挑战4:请尝试按照以下顺序猜测下一张图片,该图片取自Franois Chollet的ARC数据集。
尽管非常简单明了,但以通用方式解决这些挑战仍然超出了当今的AI系统。
以下是AI的两种主要方法,以及为什么它们不能单独解决人工智能问题。
象征性AI与通用性AI
创建人工智能的早期工作集中于创建基于规则的系统,也称为符号AI。符号AI的前提是人的大脑操纵符号。我们对对象,人物,概念,状态,动作等进行了心理表征,并使用这些表征(符号)来处理通过感官获得的信息,对我们周围的世界进行推理,形成意图,做出决定,等等
象征性AI系统取得了早期进展。在符号操作的基础上创建了计算机编程语言。您已经创建了在每种编程语言中都可以找到的类,结构,变量,函数和其他关键组件,以使人们能够将符号转换为计算机指令。
但是象征性的AI有一些根本的缺陷。它仅在您可以将任务的逻辑编码为规则时才有效。但是,为智能的各个方面手动创建规则实际上是不可能的。在20世纪80年代,人工智能科学家尝试用专家系统和基于规则的程序来编码某一特定学科(如医学)的所有知识。专家系统在非常狭窄的领域中是成功的,但在尝试扩大范围并解决更普遍的问题时就失败了。他们还需要计算机程序员和相关专家付出巨大的努力。
象征性人工智能的另一个问题是,它无法解决世界的混乱。一个示例是检测图像中的对象。计算机将视觉数据视为像素块,数字值代表图像上点的颜色。图像中的每个对象都由一个像素块表示。解决符号AI问题的简单方法是创建一个基于规则的系统,该系统将图像中的像素值与特定对象的已知像素序列进行比较。这种方法的问题在于,对象的像素值会根据其在图像中出现的角度,光照条件以及是否被其他对象部分遮盖而有所不同。
例如,考虑下面的图片集,其中都包含篮球。在图像中很明显,篮球的像素值在每张照片中都是不同的。在其中一些球中,球的某些部分被阴影或反射的强光遮蔽。在某些图片中,球的一部分被球员的手或球网遮挡了。然而在另一些地方,线条和文字却以不同的角度出现。球的大小会根据距相机的距离而变化。
要使用纯符号AI方法解决此问题,必须添加更多规则:收集在不同条件下的不同篮球图像的列表,并添加更多的if-then规则,这些规则将每个新图像的像素与您收集的图像列表进行比较。但是,篮球实际上几乎可以无限地出现在照片中,并且无论您将多少图像添加到数据库中,基于像素的逐个比较的基于规则的刚性系统都无法提供不错的物体识别精度。
记住,这是一个篮球,一个简单的球形物体,无论角度如何,都可以保持其形状。现在想象一个更复杂的物体,例如椅子,或者一个可变形的物体,例如衬衫。任务的复杂性将成倍增长。
人工智能的历史和对人类智能的研究表明,符号操纵只是通用人工智能的几个组成部分之一。
通用AI与机器学习
与符号AI的研究几乎同时进行的另一项研究重点是机器学习算法,即通过经验发展其行为的AI系统。
虽然机器学习算法具有许多不同的风格,但是它们都有相似的核心逻辑:您创建一个基本模型,通过提供训练示例来调整其参数,然后使用训练后的模型来预测,分类或生成新数据。
机器学习最流行的分支是深度学习,在过去的几年中该领域受到了很多关注(和金钱)。深度学习算法的核心是深度神经网络,它是由小型计算单元组成的层,当它们组合在一起并堆叠在一起时,可以解决以前计算机无法解决的问题。
神经网络特别擅长处理混乱的非表格数据,例如照片和音频文件。近年来,深度学习对于计算机视觉,语音识别和自然语言处理的进步至关重要。
返回上一节中提到的对象检测问题,以下是通过深度学习解决问题的方法:首先,您创建一个ConvNet,这是一种特别擅长处理可视数据的神经网络。然后,您可以在许多标有相应对象的照片上训练AI模型。最后,通过向模型提供新的图像并验证它正确地检测和标记其中包含的对象,可以对模型进行测试。
深度神经网络没有进行逐像素比较,而是开发了它们在训练数据中发现模式的数学表示。与符号AI相比,神经网络对图像中对象外观的细微变化更具弹性。
但是深度学习能解决通用的AI问题吗?当然不是。迄今为止,神经网络已被证明擅长于数据的时空一致性。但是他们像人类一样,在概括自己的能力和对世界的推理方面非常贫乏。
训练有素的神经网络可能能够在上述提到的挑战中检测到球棒,球和球员。但是很难理解场景中不同对象的行为和关系。当神经网络处理在统计学上不同于其训练示例的新颖情况(例如从新角度查看对象)时,神经网络也开始崩溃。
庞大的语言模型可能能够生成连贯的文本摘录或将段落从法语翻译为英语。但是它不理解它创建的单词和句子的含义。它基本上是根据从数百万个文本文档中收集到的统计信息来预测序列中的下一个单词。
同样,在没有任何符号操作的情况下,神经网络在许多符号AI程序可以轻松解决的问题上表现不佳,例如计数项目和处理否定。神经网络缺少您在每个基于规则的程序中都能找到的基本组件,例如高级抽象和变量。这就是为什么他们需要大量数据和计算资源来解决简单问题的原因。
简而言之,象征性AI和机器学习复制了人类智能的独立组成部分。但是很明显,如果不将所有内容汇总在一起,您将无法创建人工智能。
人工智能何时将成为现实?
科学家和专家在打破人类级AI编码需要花费多少年的时间上存在分歧。但大多数人都认为,我们距离AGI至少有几十年的路程。
尽管如此,正如人工智能社区的习惯一样,研究人员仍然固执地继续前行,不被60年来未能实现创造会思考的机器这一难以实现的梦想的所吓倒。
如今,人们进行了各种努力来概括AI算法的功能。再一次,就像人工智能的许多其他事情一样,有很多分歧,但一些有趣的方向正在发展。
一些科学家认为,前进的道路是混合人工智能,即神经网络和基于规则的系统的组合。他们认为,混合方法将结合两种方法的优势,并帮助克服它们的缺点,并为人工通用智能铺平道路。
其他科学家认为,基于纯神经网络的模型最终将发展出他们目前缺乏的推理能力。关于创建深度学习系统的大量研究,这些系统无需人类开发人员的明确指导即可执行高级符号操作。该领域中其他有趣的工作是自我监督学习,这是深度学习算法的一个分支,它将像人类儿童一样学习和体验世界。
这些方法中的任何一种最终将使我们更接近AGI,还是会发现更多的障碍?时间会证明一切。但是可以肯定的是,在此过程中将会有许多激动人心的发现。
领取专属 10元无门槛券
私享最新 技术干货