被称为神经网络的人工智能系统可以识别图像、翻译语言,甚至掌握古老的围棋游戏。但它们处理复杂的数据或变量之间关系的能力依然很有限,这使得它们还无法胜任需要逻辑推理的任务。
《自然》杂志发表的一篇论文中,谷歌独资子公司DeepMind宣布,该公司已经创造了一个具有外部存储器的神经网络,从而迈出了克服这个障碍的第一步。这个组合不仅允许神经网络进行学习,而且允许其使用存储器来存储和读取数据,从而可以像传统算法一样进行推断。这反过来又使它能够在没有任何先验知识的情况下解决逻辑难题,例如在伦敦地铁网中进行导航的问题。解决这些问题对专门设计用来解决这类问题的算法来说并不新奇,其意义是在没有任何预定义规则的前提下使用该混合系统来完成目标。
加拿大蒙特利尔大学的计算机科学家Yoshua Bengio表示:“尽管这种方法并不完全是新的—DeepMind公司曾在2014年发表过类似的成果—此次所取得的进展仍然是惊人的。”
神经网络通过加强虚拟神经元单元之间的连接进行学习。如果没有存储器,这样的神经网络可能需要上千次查看详细的伦敦地铁地图来找到最佳路线,从而实现导航。DeepMind公司开发的新系统—被称为“可区分神经计算机”—可以理解一份它从未见过的地图。它首先在随机生成的地图结构上(可以表示通过线连接起来的站点,或其他关系)训练其神经网络,在这个过程中学习如何将对这些关系的描述存储到其外部存储器,并回答与其相关的问题。面对一份新地图,DeepMind的系统可以将这些新关系—在论文中的一个例子是地铁站之间的联系—写入存储器,并通过读取这些关系来规划路线。
DeepMind的人工智能系统使用相同的技术来解决需要推理过程的难题。在使用20种不同类型的问题和相应答案进行培训后,系统学会了进行准确的推导。例如,在被告知“约翰拿起了足球”和“约翰在操场上”之后,系统能够正确推导出“操场上有一个足球”。该系统能够在超过96%的时间内对这种问题做出正确推断,其表现优于“回归神经网络”。这种网络也有一个存储器,但其存储器存在于本身网络结构内部,因此不如外部存储器灵活。
DeepMind公司的计算机科学家、论文作者之一Alex Graves表示:虽然DeepMind的技术只证明了其在人工智能问题上的有效性,它也可以被用于在真实世界的海量数据中进行推断的任务。这能解决那些无法从数据集中找到明确答案的问题。例如,确定两个人是否同时住在同一个国家,该系统可能会从他们各自的维基百科页面中寻找证据。
虽然DeepMind的人工智能解决的问题很简单,Yoshua Bengio将其看作一个信号,即神经网络正在向超越模仿人类模式识别任务(如推理)的阶段发展。“如果我们想创造人类水平的人工智能,这种扩展是非常重要的。”