电脑识别图像的极限在何处?

作者|island

电脑一直都很擅长视觉识别。有时它们识别一系列图像中某个个体的能力能够与人类相媲美。但相似的结果是否说明了电脑能够模拟人类的视觉系统呢?回答这个问题或许可能会发现电脑系统比不上人类的地方。

《美国科学院院刊》发表了一篇论文提到了电脑和人类视觉系统的不同。

最大的差别可以总结为电脑没有人脑灵活,这同样也是语言识别系统所面临的问题:人类可以通过支离破碎的单词推测出一句话或者一段话的意思而电脑不能。同样在图像识别方面:人类可以可以破碎的线索拼凑出模糊的图像,而电脑却不行。

论文的作者使用一组模糊、复杂的图像来确定计算机视觉模块与人类大脑的差异。他们使用的图像被称为“最小识别结构”(MIRCs)都是太小或者分辨率较低的图像再缩小一点人们都无法识别出来。

他们将这一系大小逐渐减小分辨率逐渐降低的图片呈现给Amazon Mechanical Turk上成千上万的人,确定出能够被人识别出来的最后一个等级的图片。最后一个等级的图片被称为MIRC,比它等级更低的无法识别出来的被称为sub-MIRC。

人和计算机最开始以及最明显的比较是MIRCs和sub-MIRCs的识别。为了测试这一点,研究人员识别出了65%的MIRCs图片,而sub-MIRCs的正确识别率则低于20%。电脑模块的表现则不是很好,它们可以正确的分类出7%的MIRCs和2%的sub-MIRCs。这次的胜利属于人类。

人和电脑在失败开始时的方式也是十分不同的。对于人来说,MIRCs的识别在某个特定的水平上呈现悬崖式的跌落。最后识别出来的图像能被93%的人正确识别,仅仅在一个细小的改变之后,sub-MIRC的图像只能被3%的人识别出来。

而电脑没有显示出这种急剧式的下跌。作者写到:“没有哪一个模块完全复制出人类识别过程中的急剧下跌。”

在经过专业训练后,计算机在识别MIRCs方面表现的更好些,但准确性比人类相比还是较低。关于原因作者说道,这是因为电脑无法识别出图像中的独立部分,但人类可以。例如,在一张模糊的图像中有鹰的头和翅膀,人们可以通过模糊的图像指认出眼睛、嘴或翅膀。作者提到,这种识别是“超过目前神经网络模块的能力”。

总的来说,电脑在图像识别上能做的很好,但并不是十分接近人类处理相同任务时的过程。它们无法使用图像中的独立部分进行信息识别,利用最少信息识别图像上它们不如人类。

为了让计算机模块更好的工作可能需要了解我们的大脑。人类在进行图像识别时,可能先猜测图像是什么,然后再寻找特性验证或反驳最初的想法。如果是这样的话,这与计算机模块的工作程序完全不同。

转自|煎蛋(www.jiandan.com)

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-02-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏携程技术中心

干货 | 助理来也胡一川:深度学习在智能助理中的应用

作者简介 胡一川,来也联合创始人和CTO。来也专注于智能对话技术,让每个人拥有助理。此前,胡一川联合创立了影视推荐引擎"今晚看啥"并被百度收购,后加入百度任资深...

40870
来自专栏IT派

爆料 | 解析阿里妈妈如何将深度学习应用在广告、推荐及搜索业务

非常高兴与大家进行“深度学习演进之路”的交流,阿里妈妈是阿里巴巴集团下的大数据营销平台,是负责阿里巴巴变现的一个事业部。我研究的方向是机器学习、计算机视觉、推荐...

14620
来自专栏数据科学与人工智能

【机器学习】机器学习在电商文本挖掘中的应用浅析

电商平台中有海量的非结构化文本数据,如商品描述、用户评论、用户搜索词、用户咨询等。这些文本数据不仅反映了产品特性,也蕴含了用户的需求以及使用反馈。通过深度挖掘,...

44260
来自专栏新智元

UCSB研究发现计算机与人类视觉差异,用人眼搜索策略提升计算机视觉

【新智元导读】 加州大学圣巴巴拉分校的研究人员发现,当人类在寻找一个特定的物体时,经常容易看漏大小与场景的其余部分不相匹配的物体。他们研究这一现象,试图更好地理...

38370
来自专栏新智元

【Science】DeepMind关系推理ANN,在图像理解中击败人类

【新智元导读】人类通常相当擅长关系推理,但对 AI 来说是难点。谷歌 DeepMind 研究人员提出了用于关系推理的人工神经网络。它拥有处理图像、分析语言甚至学...

549170
来自专栏人工智能头条

专访微软研究院俞栋:基于深度学习的语音识别及CNTK的演进

19850
来自专栏机器之心

业界 | 深度学习也能实现「鸡尾酒会效应」:谷歌提出新型音频-视觉语音分离模型

选自Google Research Blog 作者:Inbar Mosseri等 机器之心编译 在嘈杂的环境中,人们非常善于把注意力集中在某个特定的人身上,在心...

444110
来自专栏华章科技

人工智能大拿解答机器学习30个问答

这次参加的是 Yoshua Bengio,计算机科学家,毕业于麦吉尔大学,在MIT和AT&T贝尔实验室做过博士后研究员,自1993年之后就是蒙特利尔大学任教,与...

8710
来自专栏BestSDK

今日头条公布算法:解密“垃圾信息”是如何诞生的

“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。”曹欢欢希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来。此外,...

44780
来自专栏机器之心

前沿 | 上交大&南科大最新PRL论文:成功用机器学习实现量子态分类器

据介绍,目前学术界对量子机器学习这一交叉领域包括两方面研究:一方面是利用量子力学的相干叠加或者纠缠等特性,构建能有实现加速的量子机器学习算法,如量子版本的 PC...

14200

扫码关注云+社区

领取腾讯云代金券