DeepMind重大突破:AI进化出大脑级导航能力,像动物一样会“抄小路”

DeepMind团队称,其最新研发出的一个人工智能程序具有类似哺乳动物一样的寻路能力。

AI科技评论消息:美国东部时间 5 月 9 日,一手打造 AlphaGo的DeepMind 团队又在世界顶级学术杂志《自然》上发表了一项重磅成果。在一篇题为 Vector-based navigation using grid-like representations in artificial agents 的论文中,DeepMind 团队称,其其最新研发出的一个人工智能程序具有类似哺乳动物一样的寻路能力,非常类似大脑中网格细胞的工作原理。

继在围棋棋盘上轻松战胜人类后,AI 似乎在对空间的认知和巡航能力上也要将人类“踩在脚下了。

人类在自然空间中游刃有余,可以轻松绕过障碍,找到自己与目的地间的捷径,但其背后的机理却不甚明了。

为了解开这个谜团,科学家们进行了孜孜不倦地探索。早在上个世纪六十年代末, UCL 神经生理学家 John O’Keefe 就开始研究这个问题,并在 1971 年发现位置细胞(Place Cell),大脑定位系统的第一个元件。位置细胞能在主体到达特定地点时放电,从而赋予对过往地点的记忆,但位置细胞并不是坐标,也不具备几何计算能力。

2005 年,May-Britt Moser 和 Edvard Moser 夫妇发现了大脑内嗅皮层更为神奇的网格细胞。他们记录大鼠运动时特定神经细胞被相应激活的规律,发现网格细胞能将整个空间环境划分成蜂窝状的六边形网格,就像地图上的坐标系一样。网格细胞的行为是如此令人震撼,2014 年,Moser 夫妇也因此分享了诺贝尔生理学奖。

不过,网格细胞仅仅是在空间环境中提供 GPS 定位服务吗?一直以来,人们猜测网格细胞支撑着生物的矢量巡航,即计算通向目标的距离和方向,但人们在发现网格细胞十余年后,对其计算功能以及和矢量巡航的关系,仍然未知。

这正是 Deepmind 这篇论文试图解开的谜团。

DeepMind 团队决定用人工神经网络检验上述猜想。人工神经网络是一种利用多层处理模拟大脑神经网络的运算结构。在这项工作中,研究人员首先训练循环神经网络基于运动速度信息在虚拟环境中定位。这与哺乳动物在不熟悉环境中运动定位所用到的信息非常类似。

令人震惊的是,类似网格细胞的模式,研究人员称之为网格单元,在神经网络中自然出现了。在此前的训练中,研究人员并未刻意引导神经网络产生此种结构。人工智能的定位方案,竟然与大自然亿万年进化所得到的答案如此一致。

DeepMind 团队随后利用强化学习检验这种网格结构是否能够进行矢量导航。强化学习被普遍用于训练游戏 AI ,人类告诉 AI 一种游戏的得分奖惩机制,但却不教授游戏方法,由AI在反复进行游戏、努力争取更高分的过程中自我进化。后期的 AlphaGo 就完全摈弃了人类棋谱经验,在纯粹的自我对弈中从零进化到更强版本。

研究人员将之前自动出现的网格结构与一个更大型的神经网络架构结合成了人工智能体,置于虚拟现实的游戏环境中。经历强化学习后,该人工智能在游戏迷宫中向目的地前进的导航能力超越了一般人,达到了职业游戏玩家水平。它能像哺乳动物一样寻找新路线和抄近路。

而如果将网格单元静音后,其巡航能力则大打折扣,距离和方向的计算误差都增大,证明网格模式对矢量巡航的重要性。

对于这项发现,网格细胞发现者 Edvard Moser 表示:“这篇论文横空出世,非常令人兴奋。更令人吃惊的是,从另一个角度来看,计算机模式的发展最终回归到了我们从生物学中发现的网格模式。

Deep Mind 创始人和 CEO ,论文共同作者哈萨比斯称:“我们相信人工智能和神经科学是相互启发的。这项工作就是很好的证明:通过研发出一个能在复杂环境中导航的人工智能体,我们对网格细胞在哺乳动物导航中的重要性有了更深的理解。”

DeepMind 团队相信,这一工作既是理解网格细胞计算功能的重要一步,也是人工智能发展的重要一步,显示类脑机器学习构架的重要性。而同样的方法,也可以用于研究生命的其他感知能力。

英国帝国理工学院刘芳德博士称,位置细胞和网格细胞的研究对人工智能特别是机器人系统启发很大。位置细胞其实是空间索引的数据库,描述的是拓扑空间;而网格细胞是几何计算器,描术的是欧氏空间。这种组织跟我们目前计算机科学中的技术完全不同,并有非常强的优势。

杜克大学陈怡然教授和博士生吴春鹏介绍,论文中提到的两个细节值得注意。第一,如果神经网络的损失函数中不包括正则项,那么神经网络无法表现出网格细胞功能。这一发现给了我们一个全新的角度去思考正则项的作用。第二,论文指出深度神经网络的“黑盒”特点阻碍了进一步分析网格细胞活动特性对路径整合的作用。这一点再次印证了当前研究神经网络可解释性的必要。

对此,约翰霍普金斯大学神经学家 Francesco Savelli 和 James Knierim 在同期 Nature 发表的题为 AI mimics brain codes for navigation 的新闻评述中强调:“网格模型增强了目标导向能力,这一事实证明了网格细胞在大脑中的作用。但是在模型中无法直接控制这些计算,使得我们很难对其背后的计算原理、算法和编码策略进行研究。如何让深度学习系统更加智能以理解人类的推理逻辑,是未来我们面临的一个令人兴奋的挑战。”

最后,附上论文链接https://www.nature.com/articles/s41586-018-0102-6

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-05-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

20 道面试题助你拿下微软 AI offer

微软在业界的霸主地位人尽皆知。它引领了云计算的风潮:第一季度的财报显示,微软提供的Azure服务和Office365在线版本的收入分别飙升了90%和42%。

20240
来自专栏CSDN技术头条

一文读懂数据科学、机器学习和AI的区别

当我跟别人介绍自己是一名数据科学家时,别人总会问我“数据科学与机器学习之间有什么区别?”或者“那你从事的工作一定是跟人工智能有关吧?”关于这些问题我已经回答过了...

22580
来自专栏机器学习算法与Python学习

资源 | 深度学习 & ChatBot全面总结

该总结是在EMNLP 2018中由微软首席科学家武威和北京大学助理教授严睿关于聊天机器人(ChatBots)近年来的全面总结,并附带Slides下载。

11010
来自专栏新智元

【专访】MSRA周明团队,NLP铁军“超越人类”技术揭秘

作者:弗朗西斯 【新智元导读】2018年1月3日,微软亚洲研究院的r-net率先在SQuAD EM值达到82.650,这意味着在ExactMatch (精准匹配...

36250
来自专栏新智元

【报告】神经网络:技术发展与未来挑战(PDF下载)

【新智元导读】本文为爱思唯尔收费报告。西班牙格拉纳达大学研究人员系统梳理神经网络历史,从模型、模拟器到实现几方面阐释神经网络发展,展示了随时间推移,神经网络如何...

37380
来自专栏PPV课数据科学社区

深度 | 地平线罗恒:应用深度学习的门槛是在降低吗?

导读: 地平线机器人资深算法研究员罗恒参加了钛坦白第33期,与百度资深工程师、Paddle API重构设计负责人于洋及第四范式联合创始人、首席研究科学家陈雨强一...

33460
来自专栏新智元

软件正在吃掉我们的世界,深度学习也正吃掉机器学习

【新智元导读】人工智能、机器学习、深度学习方面的文章铺天盖地,向人们传播人工智能是改变世界最具竞争力的技术,相关企业应该抓住机会作深入研究,但是人们对于这三个词...

37180
来自专栏专知

2018 AI技术、硬件与应用的全面综述:机器学习如何进化成AI

【导读】普度大学机器学习、软硬件专家Eugenio Culurciello,在其主页分享了一篇博文,详细描述了自己对机器学习、深度神经网络、人工智能的个人见解。...

35380
来自专栏机器之心

专访 | 阿里搜索事业部研究员徐盈辉:剖析阿里背后的强化学习技术

机器之心原创 作者:杜雪 2013 年,DeepMind 在 NIPS 大会上发表的一篇深度强化学习的文章,一举惊艳了学术界。2016 年 1 月,Alpha...

569110
来自专栏AI研习社

未来 3-5 年内,哪个方向的机器学习人才最紧缺?

既然已经身在工业届,那么我就谈谈工业界未来几年需要什么样的机器学习人才。不谈学术界主要还是因为大部分人最终不会从事研究,而会奋斗在应用领域。相较而言,工业界对人...

29460

扫码关注云+社区

领取腾讯云代金券