学界 | DeepMind解密黑箱的第一步:原来神经网络的认知原理和人类是一样的!

AI 科技评论按:因为AlphaGo而名声大噪的人工智能公司DeepMind近期发表了一篇论文介绍自己在神经网络的解释性问题上最新探索。论文被ICML接受后,DeepMind的研究员们又写了一篇通俗的介绍文章让更多的人理解他们的方法和效果。

以下为 AI 科技评论对DeepMind介绍文章的翻译。

人类已经教会了深度神经网络做许多惊人的事情,从识别和推理图像中的物体,到在Atari游戏和围棋中发挥出超越人类的水平,不一而足。随着神经网络的结构和所做的任务变得越来越复杂,神经网络学到的解题方法也越来越难以被人类理解。

人们把这个问题称作“黑箱”。随着神经网络越来越多地参与解决现实世界中的问题,解决这个黑箱问题也变得越发重要。

为了能够了解和解释这些神经网络系统,DeepMind的研究人员们一直在探索新的工具和方法。最近ICML就收录了一篇来自DeepMind的论文,文中他们提出了一种新的、来自认知心理学的方法,来理解深度神经网络。认知心理学通过对行为的测量来推测认知过程的机理,有许多的认知心理学论文详细解释了这些机理,同时介绍了许多验证机理的实验方法。随着最新的神经网络在特定任务上达到人类水平,认知心理学的方法就能对解决黑箱问题起到不小帮助。

黑箱

DeepMind在论文中研究了一个具体案例来展现观点,他们设计了一个阐明人类的认知过程的实验,用来对比帮助理解深度神经网络如何解决图像分类任务。

结果是,认知科学家在人类身上观察到的行为,在这些深度神经网络中也能观察到。更进一步地,人们可以从这些结果中深入理解神经网络是如何解决图像分类任务的,这些理解不仅很有用,而且还令人惊讶。总的来说,这项案例研究的成功展现出了用认知心理学方法理解深度学习系统的潜力。

测量一次性词汇学习模型中的形状偏好

在DeepMind的案例研究中,他们思考了这样一个问题:人类小孩是如何识别并分类物体的,这个问题也在发展认知心理学中得到了丰富研究。小孩有从单个例子猜测单词意思的能力,人们称作“一次性词汇学习”,这种能力非常容易获得,人们也往往以为这个过程非常简单。然而,哲学家Willard Van Orman Quine提出过一个经典思想实验,展示出了这个过程到底有多复杂:

一位实地语言学家前去体验另一种文化,这种文化中使用的语言和他以前使用的完全不一样。这位语言学家就需要找肯帮忙的当地人教他一些单词。当有一只兔子跑过的时候,当地人说“gavagai”,语言学家就要猜当地人的这个词是什么意思。对语言学家来说,这个词可以指代的内容有很多种,可能是兔子、动物、白色的东西、特指这只兔子,甚至是兔子身上单独某个部位。实际上这个词可以代指的意象是无穷多的,人类是如何在其中选中正确的那个的呢?

“gavagai”

50年以后,面对着能够做一次性词汇学习的深度神经网络,同样的问题又出现在了人们的眼前。拿DeepMind开发的“匹配网络”举例,这个模型中用到了注意力模型和记忆模型方面的近期发展,达到了仅凭单张分类示例就可以对ImageNet图像进行分类的顶尖水平。但是我们并不知道网络在给图像分类的时候采取了怎样的假设。

为了深入探究这个问题,DeepMind的研究人员参考了一些发展心理学方面的研究。这些心理学家们发现了小孩有归纳偏好的证据。这种偏好可以消除很多不正确的指代,从而让他们找到正确的指代。这种偏好包括:

  • 整个物体偏好,小孩会假定一个单词指代的是整个物体而不是它的组成部分(消除了Quine对指代兔子身上单独某个部位的担心)
  • 分类偏好,小孩会假定一个单词指代的是一个物体所属的基础分类(消除了Quine对指代“全体动物”而不是“兔子”这个基础含义的担心)
  • 形状偏好,小孩会假定一个名词的含义是根据物体的形状而不是颜色或者纹理来确定的(消除了Quine对指代所有白色的东西而不是“兔子”这个具体对象的担心)

DeepMind的研究人员测量了他们的神经网络的形状偏好,这是因为人类形状偏好的相关研究尤其多。

来自认知心理学的刺激示例,DeepMind用它们测量深度神经网络的形状偏好。这些图像是由印第安纳大学认知发展实验室的Linda Smith慷慨提供的

DeepMind的研究人员所用的经典形状偏好实验是这样进行的:给深度神经网络展示三个物体的照片,一个试验物体、一个形状匹配物体(跟试验物体的形状相同)、还有一个颜色匹配物体(跟试验物体的颜色相同、形状不同)。然后把形状偏好定义为试验物体和形状匹配物体被网络划分为同一类的情况出现的比例,从而进行测量。

实验中用到的图像就是印第安纳大学认知发展实验室的人类实验中所用的图像。

这个认知心理学实验的概要,运用了匹配网络。匹配网络会把试验图片(左侧)和图像A或者B(上方中间或者上方右侧)进行匹配。输出(右下方)就取决于这个匹配网络的形状偏好

DeepMind团队用他们的深度神经网络(匹配网络和一个基准Inception模型)进行了实验,发现他们的网络对物体形状的偏好比颜色或者材质的偏好强得多,就像人类一样。换句话说,它们确实有“形状偏好”。

这种结果就表明,匹配网络和Inception分类器中都用到对形状的归纳偏好来消除错误的假设,让研究者对这些网络解决一次性词汇学习的方法有了一个明确的了解。

除了形状偏向,DeepMind团队还发现了一些有意思的事情:

  • 他们发现形状偏好在网络的早期训练中逐渐出现。这让人联想到人类形状偏好的出现:心理学家发现更小的小孩比大一些的小孩的形状偏好要弱,成年人的形状偏好最强烈。
  • 他们发现选用不同的随机种子做初始化和训练会导致网络的偏好程度也有所不同。这说明当研究深度学习系统并做出结论时,研究的样本数量需要很大才行,就像心理学家已经知道不能只研究单个对象就得出结论。
  • 他们发现即便几个网络的形状偏好有很大区别,它们的一次性词汇学习表现却都差不多,说明不同的网络可以找到很多种同样有效的方法解决复杂问题。

这种偏好在标准的神经网络架构中就存在,但以前没有人认识到过。此次发现了这种偏好,表明了用人类创立的认知心理学阐释神经网络解题方案的潜力。其它心理学领域的研究也有可能起到帮助,情景记忆文献中的观点可能可以帮助理解情景记忆架构,语义认知文献中的方法可能可以帮助理解近期的概念形成模型,以上在内的许多心理学领域都有丰富的文献,很有可能会给人类带来强有力的新工具,帮助解决“黑箱”的问题,也让人类更好地理解神经网络的各种行为。

论文地址:https://arxiv.org/abs/1706.08606

via DeepMind Blog, AI 科技评论编译

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

深度 | 迁移学习全面概述:从基本概念到相关研究

选自sebastianruder.com 作者:Sebastian Ruder 机器之心编译 参与:马亚雄、吴攀、李亚洲 将在一个场景中学习到的知识迁移到另一个...

2717
来自专栏新智元

深度学习会让机器学习工程师失业吗?

有人说,每10到15年神经网络就会经历一个这样的循环:由于人们变得对大规模凸优化问题兴致盎然,神经网络会被遗忘10年——然后换上一个性感的新名字(比如深度学习)...

3547
来自专栏AI

什么是深度学习?

深度学习是机器学习的一个子领域,涉及被称为人工神经网络的大脑的结构和功能所启发的算法。

2507
来自专栏机器学习算法与Python学习

推荐 | 一文读懂深度学习与机器学习的差异

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 转自:小象 源 | dzone.co...

3757
来自专栏奇点大数据

机器学习工程师必知的十大算法

作者 James Le ,译者 尚剑 毫无疑问,机器学习/人工智能的子领域在过去几年越来越受欢迎。目前大数据在科技行业已经炙手可热,而基于大量数据来进行预测或者...

3294
来自专栏专知

【干货】ICCV2017 PoseTrack challenge优异方法:基于检测和跟踪的视频中人体姿态估计

【导读】近日,针对视频中场景复杂、人物众多等困难挑战,来自Facebook、CMU和达特茅斯学院的研究人员提出了一种新颖的基于检测和跟踪的视频中人体姿态估计方法...

3586
来自专栏AI科技评论

干货 | 中科院计算所王晋东:迁移学习的发展和现状 | 分享总结

AI科技评论按:伴随着最近几年的机器学习热潮,迁移学习 (Transfer Learning)也成为目前最炙手可热的研究方向。 迁移学习强调通过不同领域之间的知...

3447
来自专栏机器之心

学界 | 复现深度强化学习结果所面临的挑战与建议

选自arXiv 机器之心编译 参与:蒋思源、路雪 本论文对强化学习顶尖试验结果的复现性进行了详细的探讨,并讨论了超参数和随机种子等变量对强化学习模型复现性的重要...

2568
来自专栏AI科技评论

想了解机器学习?你需要知道的十个基础算法

关于机器学习,你需要知道的十个基础算法 毫无疑问,作为人工智能的子领域—机器学习在过去的几年中越来越受欢迎。由于大数据是目前科技行业最热门的趋势,基于大量的数据...

3156
来自专栏数据科学与人工智能

想了解机器学习?你需要知道的十个基础算法

毫无疑问,作为人工智能的子领域—机器学习在过去的几年中越来越受欢迎。由于大数据是目前科技行业最热门的趋势,基于大量的数据机器学习在提前预测和做出建议方面有巨大的...

2464

扫描关注云+社区