DeepMind开源Psychlab平台——搭建AI和认知心理学的桥梁(附论文和代码下载)

【导读】DeepMind近期开源了Psychlab,这是一个利用认知心理学等领域知识来研究受控环境下人工智能体(Artificial Agent)的行为,从而模拟人类的行为。Psychlab通过一系列典型的任务证明其人工智能体(Artificial Agent)的行为的可靠性:包括视觉搜索、连续识别、多目标搜索等任务。同时也提供了简单实用的API,使其他研究者可以在其基础上轻松构建自己的任务。DeepMind出品必出精品!我们在文末附有paper链接和代码地址,感兴趣的读者可不要错过。专知内容组编辑整理。

Open-sourcing Psychlab

考虑一下在购物的时候,如果你没有把清单上一个商品取出,这告诉我们了什么:“关于大脑此时的功能?”。这可能表示在搜索商品列表的时候,你无法将注意力从一个商品移动到另一个商品;也可能表示记住购物清单是有困难的,也可能这两者都有。

好像单一的任务取决于多种认知能力。 我们在人工智能研究中也面临类似的问题,在这种情况下,任务的复杂性往往会使一个取得成功的agent中的个体技能难以分离。 但是了解agent特定的个体技能可能对改善其整体表现有作用。

为了解决这个问题,心理学家花了近150年的时间来设计严格控制的实验,目的是隔离特定的认知能力。例如,他们可能会使用两个独立的测试来分析超市的场景——一个“视觉搜索”测试,需要被测者定位图案中的特定的形状,可以用来探测注意力;同时他们可能会要求受测试者回忆列表中的东西来测试他们的记忆力。

我们相信可以使用类似的实验方法来更好地理解人工智能体(artificial agents)的行为。 这就是我们开发Psychlab的原因,它能直接运用认知心理学等领域的方法来研究受控环境下人工智能体的行为,Psychlab是在DeepMind实验室研究基础上建立的平台。 今天,我们开放这个平台供其他人使用。

Psychlab对虚拟DeepMindLab环境(virtual DeepMind Lab environment)中常用的人类心理学实验的结构进行重构。这一般包括一个参与者坐在电脑显示器前,用鼠标对屏幕上的任务做出响应。类似地,我们的环境允许虚拟主体在虚拟计算机监视器上执行任务,利用它的注视方向进行响应。这允许人类和人工因素都采取相同的实验设置,最大限度地减少实验差异。 这使得它更容易与认知心理学的文献联系起来,以便从中获得思路。

随着Psychlab的开源版本的发布,我们构建了一系列典型实验任务,并在虚拟计算机监视器上进行测试,我们提供灵活且易于学习的API,使其他人能够很容易构建自己的任务。

  • 视觉搜索(Visual search)——测试搜索目标数组的能力。
  • 连续识别(Continuous recognition)——为不断增长的物品列表测试内存。
  • 任意的视觉运动测试(Arbitrary visuomotor mapping)——测试回忆的刺激,响应配对。
  • 更改检测(Change detection)——测试当数组中更改检测对象并经过短暂延迟后目标重新出现的能力。
  • 视觉敏锐度和对比敏感度(Visualacuity and contrast sensitivity)——测试识别小对比度和低对比度刺激的能力。
  • 玻璃图案检测(Glass pattern detection)——测试全局形式感知。
  • 随机点运动判别(Randomdot motion discrimination)——检测对相关运动的感知能力。
  • 多目标跟踪(Multipleobject tracking)——测试随着时间的推移能够跟踪移动对象。

上述任务中的每一个任务都已被验证,表明我们的实验结果反映了认知心理学文献中的标准结果。

以“视觉搜索”任务为例。 这是一种理解人类选择性注意力的方法,已经研究了在复杂的刺激阵列中定位目标的能力,如超市货架上的一个商品。

当人们搜索“在水平条块之间的垂直取向的条块”和“在其他颜色的条块之间搜索粉色条块”的任务时,其反应时间不会根据屏幕上的条块数量改变而改变。换句话说,他们的反应时间是独立的“设定值”。 然而,当任务是“搜索不同形状和不同颜色的条块中的粉色条块时”,人的反应时间随着每增加一个条块就会增加大约50ms。 当人类在Psychlab上完成这个任务时,我们重现了这个结果。

这张图片说明了在Psychlab的视觉搜索任务上人类和人工代理之间反应时间的差异。

当我们对一个最先进的人工智能体进行同样的测试时,我们发现它虽然可以执行任务,但并没有显示人类模式(human pattern)的反应时间结果。 在这三种情况下,他们用了相同的时间来应对。 在人类视角,这些数据暗示了并行和串行关注的区别。人工智能体似乎只有并行的机制。 识别这种人类与目前的人工智能体之间的差异,为我们未来设计智能体提供了思路。

Psychlab被设计为认知心理学、神经科学和AI之间桥接的工具。 通过开源的方式,我们希望更多研究团队能够在自己的研究中利用它,并帮助我们进一步改进。

Paper链接:

https://arxiv.org/abs/1801.08116

从GitHub下载代码:

https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab

原文链接:

https://deepmind.com/blog/open-sourcing-psychlab/

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏软件测试经验与教训

如何设定性能测试的目标?

55060
来自专栏AI派

一文告诉你到底什么是推荐系统

到底什么是推荐系统?按照维基百科的定义:它是一种信息过滤系统,用于预测用户(User)对物品(Item)的评分和偏好。这个定义不是很好理解。我们可以从以下几个角...

366100
来自专栏BestSDK

GitHub 发布 2018 年开源项目趋势

去年,Github 有来自将近 200 个国家的 2400 万的开发者聚集在一起,共同编写更好更强大的代码。2017 年,从框架到数据可视化,共构建了 2500...

38350
来自专栏新智元

谷歌双语助理来了!中英夹杂也不怕,递归神经网络和随机森林显神威

多语家庭正变得越来越普遍,有一些研究发现多语人口已经超过单语人口,而且这个数字还将继续增长。随着多语用户数量的不断增加,开发能够同时支持多种语言的产品比以往任何...

13520
来自专栏CSDN技术头条

如何成为一名数据科学家

本文是出自Springboard上面一篇文章的摘录,介绍了如果想成为一名数据科学家,需要掌握哪些技能,熟练使用哪些工具,以及如何对数据进行处理等。 ? 数据科学...

227100
来自专栏北京马哥教育

用Python玩GTA 5—使用OpenCV读取游戏面面

原文名称:Reading game frames in Python with OpenCV - Python Plays GTA V 原文链接:https:/...

57080
来自专栏企鹅号快讯

语音识别类产品的分类及应用场景

前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) ? 音频由...

526110
来自专栏PPV课数据科学社区

从实战角度解读数据科学

原文:What is hardcore data science—in practice来源:https://www.oreilly.com/ideas/wha...

36350
来自专栏PPV课数据科学社区

【译文】什么是数据可视化?②

Have you heard about data visualisations, wondered what a visualisation is, why ...

30740
来自专栏ATYUN订阅号

最适合人工智能的编程语言:JAVA人工智能程序编程

可用于开发人工智能项目的程序编程语言列表,包括Python,POP-11,C ++,MATLAB,Java,Lisp和Wolfram语言。在本文中,你会了解Ja...

59990

扫码关注云+社区

领取腾讯云代金券