学界 | 深度神经网络比拼人类视觉:信号弱时的物体识别差异

选自arXiv

机器之心编译

参与:Smith

近日,来自德国 Tubingen大学和Potsdam大学的研究人员们共同发布了一项研究成果——深度神经网络和人类视觉在信号变弱时进行物体识别的差异对比。这些专家分别来自神经信息处理、综合神经学、心理学与生物控制等不同领域。此项研究旨在对DNN和人类神经系统的结构和处理过程的差别作出相应解释,并且找到在信号变弱时两种视觉系统的分类错误模式的不同。

论文:Comparing deep neural networks against humans: object recognition when the signal gets weaker

论文链接:https://arxiv.org/pdf/1706.06969.pdf

摘要:人类视觉在进行物体识别时通常是很迅速的,而且似乎毫不费力,并且很大程度上与视角和面向对象无关。直到最近,动态视觉系统才有能力完成这一非凡的计算技能。这正是随着一类叫做深度神经网络(DNN)算法的出现而改变的,它在物体识别任务中已经可以达到人类级别的分类表现。而且,更多与 DNN 方法相类似的研究报告,还有人体视觉系统处理物体的进程,都表明现在的 DNN 可能就是人类视觉进行物体识别的良好模型。然而,最新型的 DNN 和灵长类动物的视觉系统确实在结构和处理过程上还存在着明显的不同。这些不同的潜在的行为结果还不能得到充分的解释。我们的目标正是通过比较人类和 DNN 对图像降解(image degradations)的整合能力来解决这一问题。我们发现人类视觉系统对图像处理操作具有更好的鲁棒性,比如在反差衰(contrast reduction)、加性噪声(additive noise)或者新型的幻象失真(eidolon-distortions)这些方面。而且我们逐步地找到了在信号逐渐变弱时,人类和 DNN 进行分类时的错误方式的不同,这表明人类和现在的 DNN 在进行视觉物体识别(visual object recognition)时仍旧存在着很大差异。我们希望我们的发现,还有我们经过仔细测试而且可以自由使用的行为型数据集,可以给计算机视觉界提供一种新的且实用的基准,从而来增强 DNN 的鲁棒性,并且促使神经科学家去搜寻可以促进这种鲁棒性的大脑机制。

图 1. 实验原理图。在呈现出一个中央固定方块之后(300 ms),图像在 200ms 的情况下可视,紧接着是一个 1/f 频谱(200ms)的噪声屏蔽(noise-mask)。然后,在 1500ms 时出现一个响应屏,在这里观察者可以点击一个类别。注意我们在这张图中增强了噪声屏蔽的对比,这是为了在出版时拥有更好的可视性。从上到下的类别分别是:刀具,自行车,熊,卡车,飞机,表,船,小汽车,键盘,烤箱,猫,鸟,大象,椅子,瓶子,狗。这些图示是 MS COCO(http://mscoco.org/ explore/)版本的修改版。

图 2. 颜色试验结果(n=3)。(a)精度。DNN 对应蓝色,人类对应红色;菱形对应 AlexNet,方形对应 GoogLeNet,三角是 VGG-16,圆圈是人类观察者。(b)响应分布熵(Response distribution entropy)。

图 4. 预估刺激信号(Estimated stimuli)对应 50% 分类精度。(a)噪声实验。(b)Eidolon 实验。连贯性参数=1.0。首行:刺激信号(stimuli)对应平均人类观察者的阈值(threshold)。底下三行:刺激信号对应 VGG-16(第二行), GoogLeNet(第三行)和 AlexNet(最后一行)的相同精度。

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

深度 | Ian Goodfellow AIWTB开发者大会演讲:对抗样本与差分隐私

机器之心整理 演讲者:Ian Goodfellow 参与:吴攀、李亚洲 面向开发者的世界上最大的人工智能主题在线演讲与对话大会 AI WITH THE BEST...

46580
来自专栏新智元

谷歌大脑与Open AI合著论文:机器视觉的一个致命缺陷

【新智元导读】计算机视觉很厉害,但是,只要稍加修改,比如使用美图软件加一个滤镜,计算机视觉就错误频出。MIT报道把这一缺陷称为计算机视觉的“阿喀琉斯之踵”,认为...

36680
来自专栏CDA数据分析师

干货 | 机器学习没有你想的那么复杂

人脑是最神奇的。你知道我更感兴趣的是什么吗?是我们的学习能力。我们如何能够适应并学习全新的技能,然后应用到日常生活之中呢?

8540
来自专栏新智元

CVPR 2018:用GAN预测20年后你长什么样

27530
来自专栏新智元

Science重磅!用光速实现深度学习,跟GPU说再见

深度学习对算力的需求没有止境,但受制于能耗和物理极限,基于硅基的电子元件虽然现在还能支撑,但远处那堵几乎不可逾越的高墙已然显现。

24830
来自专栏AI科技评论

如何玩转谷歌TensorFlow? | 牛人讲堂

AI并不是一门简单的学科,AI算法的开发和调试并没有一个统一的、集成了大量API方便调用的平台和语言,目前的人工智能开发平台仍然处于一种半蛮荒的状态。许多功能需...

35560
来自专栏技术翻译

揭开人工智能、机器学习和深度学习的神秘面纱

深入学习,机器学习,人工智能——所有代表分析的未来的流行词。在这篇文章中,我们将通过一些现实世界的例子来解释什么是机器学习和深度学习。在以后的文章中,我们将探讨...

10100
来自专栏深度学习那些事儿

一篇文章解决机器学习,深度学习入门疑惑

研究生有不少日子,和之前的几个学长以及几个学弟偶尔也聊聊天。大部分聊的话题无关乎这几年大火的机器学习深度学习神经网络,而这篇文章的目的,则是从学生的角度(不管是...

69670
来自专栏新智元

9月机器学习文章Top10:星际2、Dota2皆入选,ML教程居榜首

【新智元导读】Mybridge AI(www.mybridge.co)基于文章的内容质量和热议程度对 9 月份和机器学习相关的论文进行了排名,从近 1400 篇...

37880
来自专栏浮生的专栏

机器学习为更好的火灾现场安全

当勇敢的消防员身处险境试图抢救其他人和他们的财产的时候,他们的生命同样受到了威胁。在这篇文章中,我想分享我在AAIA第15届数据挖掘竞赛中的经验和获奖策略:给火...

24540

扫码关注云+社区

领取腾讯云代金券