DeepMind重大突破:AI学会了“抄近路”

美国东部时间5月9日,AlphaGo的创造者Deepmind团队又在Nature上发表了一篇论文,题目为Vector-based navigationusing grid-like representations in artificial agents,DeepMind表示其AI智能技术又有了进一步突破,它能像哺乳动物一样“抄近路”,非常接近人和动物在认路过程中大脑网格细胞的工作机理。

对于人类以及大多数其他哺乳动物而言,根据自己的目的地找到一条捷径,并原路返回并不是一件难事,但是对于这种能力背后的机理却不是很清楚。虽然人类和动物能够很轻松的做到这一点,对于能力远远超过哺乳动物能力的人工智能而言仍然是一个重大挑战。

在2005年,科学家们在动物和人类大脑中发现了三种跟认路相关的细胞:位置细胞、方向细胞和网格细胞。位置细胞能在主体到达特定地点时放电,从而赋予大脑对走过的道路的记忆;方向细胞可以感应前进的方向;网格细胞则是最神秘的一种,动物在认路时网格细胞神经会以惊人的正六边形模式发射,他们认为这种网格有利于空间导航,类似于地图上的网格线。

首次发现网格细胞的May-BrittMoser和EdvardMoser夫妇共同获得2014年诺贝尔生理学或医学奖。但自从获得这一发现以来,经过10多年的理论论证,网格单元的计算功能到底能达到什么程度,以及它们是否能够支持基于矢量的导航至今仍然是一个谜。

一些科学家猜测,网格细胞也会参与矢量计算,辅助动物规划路线。为了验证这一假设,Deepmind团队进行了大量研究,他们决定用人工神经网络进行检验。

人工神经网络是一种利用多层次处理模拟大脑神经网络的运算结构。他们首先利用深度学习算法训练神经网络学习哺乳动物觅食的运动路径,利用线性速度、角速度等信号进行定位。当哺乳动物在不熟悉的地方移动时,或者在不容易发现熟悉的地标的情况下(例如在黑暗中驾驶时)通常会使用到大脑神经网络的这种能力。

在后续研究中,研究人员发现一种类似网格细胞活动特征的结构(以下称为网格单元)自动产生了,与在觅食哺乳动物中观察到的神经活动模式十分类似。

接下来,DeepMind团队利用强化学习检验这种网格结构是否能够进行矢量导航。强化学习被普遍用于训练游戏AI,人类告诉AI一种游戏的得分奖惩机制,但是不告诉它方法,由AI反复进行游戏,并努力获取高分,在这个过程中实现自我进化。

研究人员将之前自动出现的网格结构和一个更大型的神经网络架构结合起来,形成人工智能体,置于虚拟现实的游戏环境中。经历了强化学习后,人工智能在游戏迷宫中向目的地前进的导航能力超出了专业游戏玩家,展现了通常与动物相似的灵活导航能力,并且可以找到新路线和捷径。

过一系列实验操作,研究人员发现网格单元对于基于矢量的导航至关重要。如果将网络中的网格单元静音,其导航能力将大打折扣,关键指标(如到目标的距离和方向)都会变得不够准确。

其论文作者之一Dharshan Kumaran表示:“我们证明了网格细胞远不只是给我们提供GPS定位信号,也是一种大脑赖以计算两个地点间的最短距离的核心导航机制。”

哈萨比斯说,要证明我们能构建出来通用智能,大脑的存在就是一个证据。所以从神经科学中为新的算法寻找灵感,是很有道理的。但我们同时也相信这种启发应该是双向的,人工智能研究的见解也能为神经科学中的开放问题提供灵感。

“这项工作就是一个很好的例子,通过构建一个能在复杂环境中导航的人工智能体,我们强调了生物网格细胞在哺乳动物导航中的重要性,也深化了在这方面的理解。”哈萨比斯表示。

DeepMind团队相信,类似的研究方法还可以用来探索大脑听觉和控制四肢的机制。在更远的将来,神经科学家们甚至可以用人工智能代替小白鼠来做实验。同时也用人工智能验证了哺乳动物大脑中的“网格细胞”对基于向量的导航有支持作用。

原文链接:

https://deepmind.com/blog/grid-cells/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180515G04R2300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券