【开源】DeepMind开源Psychlab,将人工智能与心理学联系起来

想一想像购物这样的简单任务。如果你没法拿起你的购物清单上的商品,这可以告诉我们关于你的大脑的什么功能?它可能表明在搜索列表中的商品时,你无法将注意力从一个商品转移到另一个商品上。这可能表明记住购物清单的困难。或者两者都有。

看起来单一的任务实际上依赖于多种认知能力。我们在人工智能研究中也面临类似的问题,在这种情况下,任务的复杂性往往会使智能体取得成功所需的单个技能难以分离。但是了解智能体特定的认知技能可能会对改善其整体表现有用。

为了解决人类的这个问题,心理学家在过去的150年里设计了严格控制的实验,目的是隔离一个特定的认知能力。例如,他们可能会使用两个独立的测试来分析超市的场景 – 一个“视觉搜索(visual search)”测试,它需要被测者在一个图案中查找一个特定的形状,可以用来探测注意力,他们可能会要求一个人回想研究列表中的商品来测试他们的记忆。

我们认为可以使用类似的实验方法来更好地理解人造智能体的行为。所以我们开发了Psychlab这个建立在DeepMind实验室的平台,它使我们能够直接运用认知心理学等领域的方法来研究受控环境下人造智能体的行为。今天,我们开放这个平台供其他人使用。

Psychlab重现了虚拟DeepMind Lab环境中通常用于人类心理学实验的设置。这通常包括坐在电脑显示器前使用鼠标来响应屏幕上任务的参与者。同理,我们的环境允许虚拟主体在虚拟计算机显示器上执行任务,使用它的注视方向进行响应。这使人类和人工因素使用相同的测试,最小化实验差异。也使得它更容易与认知心理学的现有文献联系起来,并从中获得思路。

随着Psychlab的开源版本的发布,我们构建了一系列在虚拟计算机监视器上运行的经典实验任务,并且它们具有灵活且易于学习的API,使其他人能够构建自己的任务。

  • 视觉搜索 -测试搜索目标物品数组的能力。
  • 连续识别 – 为越来越多的项目测试内存。
  • 任意视觉运动学映射 -测试刺激反应回忆的配对。
  • 更改检测 – 检测延迟后重新出现的对象数组中变化的能力。
  • 视觉锐度和对比敏感度 -检测识别小对比度和低对比度刺激的能力。
  • 玻璃图案检测 -测试全局形式的感知。
  • 随机点运动判别 -检测相干运动的能力。
  • 多个对象跟踪 -测试随着时间的推移跟踪移动对象的能力。

每一项任务都经过验证,证明我们的人类结果与认知心理学文献中的标准结果是一致的。

以“视觉搜索”任务为例。在复杂的刺激物中定位物体的能力,比如超市货架上的一件物品,已经被研究作为一种理解人类选择性注意的方法。

当人们被赋予“在水平条之间搜索竖直条”和“在各种颜色的条之间搜索粉条”的任务时,其反应时间不会根据屏幕上的条数量而改变。换句话说,他们的反应时间是“固定大小”。然而,当任务是在不同形状和不同颜色条中搜索粉条时,人的反应时间每增加一个条就会增加大约50ms。当人类在Psychlab上完成这个任务时,我们复制了这个结果。

这张图片说明了在Psychlab的视觉搜索任务上人类和人造智能体反应时间的差异

当我们对一个最先进的人造智能体进行相同的测试时,我们发现它虽然可以执行任务,但显示反应时间的结果并不是人类模式。在这三种情况下,他们用了相同的时间来应对。对于人类而言,这些数据暗示了并行和串行关注的区别。智能体似乎只有并行机制。识别人类与我们目前的人造智能体之间的这种差异,为未来改善智能体设计提供了思路。

Psychlab被设计为认知心理学、神经科学和人工智能之间的桥梁。我们将其开源,已期更多的研究群体能够在他们的研究中利用它,并帮助我们塑造未来。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-01-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

别错过这张AI商用清单:你的生产难题可能被一个应用解决

1453
来自专栏云市场·精选汇

如何细致地为用户提供业务知识服务?

近年随着深度学习及强化学习技术的进一步深入,智能问答机器人所依赖的知识库构建与维护成本也随之减少。大数据分析和智能语音技术在客服场景深入应用,AI正在变革客服行...

952
来自专栏CDA数据分析师

基于大数据的用户画像构建(理论篇)

文 | 罗宇矗 什么是用户画像? 简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户...

2818
来自专栏AI研习社

数据科学、机器学习、人工智能,都有哪些区别?

当我向别人介绍我是数据科学家时,我常常被问到“数据科学和机器学习有什么区别”或者“这是否意味着你在从事人工智能工作?”类似问题我已经回答过很多次,答案可以总结成...

3739
来自专栏灯塔大数据

荐读|电信大数据关键技术挑战

电信大数据来源于运营商通信网络平台的BSS和OSS,沉淀了海量用户7个维度的信息:1维用户真实ID、1维行为数据、1维社交数据、1维时间数据和3维空间数据。运营...

3377
来自专栏AI科技大本营的专栏

AI一分钟 | 柯洁将对战中国AI棋手星阵围棋;上海大学研发出制药界“AlphaGo”;Pornhub清理AI换脸视频失败

整理 | DavidZh 1. 柯洁将对战新的 AI 棋手——星阵围棋 Golaxy 网信集团和星阵围棋文化在昨天举行的发布会上宣布,4 月 27 日,柯洁...

28610
来自专栏企鹅号快讯

滑铁卢大学开发了一套AI工具,教泥瓦匠初学者搬砖诀窍

科技行者报道 来源:INSIDE SCIENCE 编译整理:科技行者 经验丰富的泥瓦匠通常具备老道的习惯性技巧和技术以减轻负载于身上的压力。然而,这些技巧并不总...

1847
来自专栏PPV课数据科学社区

数据挖掘:层次性和时髦性

在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸...

3426
来自专栏人工智能快报

美情报机构拟资助研发可预测未来的智能工具

2016年7月6日,美国国防系统网发布消息称,美国情报高级研究计划局(IARPA)计划资助研发可预测未来的智能工具。 随着来自传感器及其他来源的信息的大量涌入,...

3497
来自专栏IT大咖说

Kubeflow用户研究:Data Scientist是一群什么生物?

内容来源:2018 年 04 月 22 日,Pinlan创始人兼CEO李一帆在“全球首发| Kubeflow Meetup 4.22 杭州场,开拓 AI 新视野...

1002

扫码关注云+社区