前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DeepMind新论文:用认知心理学方法打开深度学习的黑箱

DeepMind新论文:用认知心理学方法打开深度学习的黑箱

作者头像
量子位
发布2018-03-29 10:24:00
1.1K0
发布2018-03-29 10:24:00
举报
文章被收录于专栏:量子位量子位
唐旭 李林 编译整理 量子位 出品 | 公众号 QbitAI

最近,DeepMind在Arxiv上发布了Interpreting Deep Neural Networks using Cognitive Psychology,将认知心理学的方法引入深度神经网络的研究。

这是DeepMind入选今年ICML(机器学习国际会议)的论文之一。在公开论文的同时,他们还在官方博客上对这篇论文做了介绍。

为什么要用认知心理学方法来研究深度神经网络呢?

我们经常在新闻中看到,深度神经网络的能力不断提升,在图像识别、语音识别以及玩各种游戏的能力上,一一超越了人类。

不过,随之而来的也是越来越复杂的架构,和越来越看不懂的决策过程。

也就是所谓的“黑箱”问题。

黑箱

现在,每次提到深度学习,“黑箱”这个词似乎如影随形。DeepMind的论文中说,“这种不透明性不仅阻碍了尝试提升这些模型的基础性研究,也影响了它们在实际场景中的落地。”

怎么打开这个黑箱,成了研究界关注的一大问题。很多团队想开发“可解释的人工智能”,让AI解释自己的行为。但是,Google工程总监、AI经典教材《人工智能:一种现代的方法》的第二作者Peter Norvig说,这根本就行不通

人类都不擅长不了自己,就别指望机器了。

DeepMind这篇论文,正是把研究人类心智这个大黑箱的方法,用到了深度神经网络上:通过测量神经网络的行为来推断内在的认知机制。

他们借用了一个用以说明人类认知过程的实验,来理解深度神经网络怎样解决图像分类任务。

形状偏好

DeepMind这篇论文,借用了发展心理学中研究儿童如何学习物体和词对应关系的方法,来分析深度神经网络。

认知心理学研究表明,人类儿童在将物体和词对应起来的过程中,存在三种偏好:

整体偏好:当你指着一个物体,说出一个词,孩子会假设这个词指的的整个物体,而非部件;

分类偏好:孩子会假设一个词指的是物体所属的基本类别;

形状偏好:孩子会假设一个名词的意思是基于物体的形状,而不是它的颜色或质地。

DeepMind借用的,是研究形状偏好的认知实验,因为认知心理学在这方面的研究最为丰富。

DeepMind测量深度神经网络的形状偏好所用的刺激物样本,由印第安纳大学认知发展实验室的Linda Smith提供

DeepMind所用的经典形状偏好实验过程如下:

1. 给深度神经网络看三个物体的图片:1)基本调查物体、2)形状匹配但颜色不匹配的物体、3)颜色匹配但形状不匹配的物体。

2. 比较神经网络在分配标签时,为物体1和2分配相同标签的次数,和为物体1和3分配相同标签的次数所占比例如何。

实验示意图

DeepMind的实验表明,深度神经网络和人类一样,具有“形状偏好”。

论文摘要

深度神经网络(DNN)在众多领域的复杂任务上都有着卓越的表现,它迅速地刷新着我们对于这些问题的认知。

过往的工作只着眼于推进我们对于这些模型的理解,但对于认知心理学家在这些问题上已有的描述、理论和实验方法,却没有加以充分利用。

为了发掘这些工具的潜在价值,我们选择了在发展心理学中一种用来“解释儿童如何学习物体和词对应关系”的固定分析方法,并将其应用到DNN上。

用和原有认知心理学实验类似的刺激物数据集进行测试,我们发现,那些在ImageNet上训练的、最好的单个样本学习(one shot learning)模型表现出了一种与在人类身上观察到的相似的偏好:它们更喜欢根据形状来对物体进行分类,而不是颜色。

在这种偏好的程度在架构相同但seed不同的模型上,会有非常大的差异,甚至会在训练过程中随着seed而波动,尽管它们最终在分类上的表现近乎相同。

这些结果证明了认知心理学工具在发掘DNN隐含计算属性上的能力,同时也为我们提供了一种用于人类字词学习的计算模型。

相关链接

论文地址: https://arxiv.org/pdf/1706.08606.pdf

博客文章: https://deepmind.com/blog/cognitive-psychology/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 黑箱
  • 形状偏好
  • 论文摘要
  • 相关链接
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档