重磅 | 美国西北大学新系统在智力测试中超越75%民众,人类的推理能力也不及AI了?

你听过瑞文氏标准推理测试(Raven’s Progressive MatriCES)么?上面这张图就是一道标准的瑞文氏测试题目,是不是很眼熟?在公务员考试、一般的智力测试中我们经常看到它。

那么问题来了,你知道图中这道题的答案么?如果不知道,也用不着沮丧,因为有75%的美国人大概也不知道。但坏消息是:计算机可能知道。

近日,美国西北大学的科研团队研发了一个全新的计算模型,在瑞文氏标准推理测试中达到或超越了75%美国普通大众的表现。被媒体誉为人工智能史上的又一里程碑。

要知道,根据2016年的数据显示,一般18岁成年人的平均智商为97,6岁儿童的平均智商为55.5,相比之下谷歌人工智能系统的智商则为47.3,微软小冰是24.5。人工智能的智商还不及6岁儿童的平均水平。

团队负责人,来自西北大学McCormick工程学院的Ken Forbus教授对此表示:“模型在智力测试中的表现优于75%的美国大众,这意味着人工智能的逻辑推理能力已经高于人类的平均水平,起码在测试题中如此。另外,由于对人来说很难的题目对模型来说通常也很难,这表示该模型已经可以表现出一些人类认知系统中特有的重要属性。”

Ken Forbus教授

实力这么强,这个模型到底是如何工作的呢?

据悉,该模型建立在一个名为CogSketch的“草图”(sketch)理解系统之上,该系统同样是Ken Forbus团队的研究成果。这里“草图”是指人们在思考问题或表达观点时自然而然在纸上画下来的说明性图样,特别是面对有关空间理解和地理学的相关问题时,尤其必要。CogSketch系统可以基于草图进行空间建模和逻辑推理,再配合此次最新研发的计算模型,因而能够在瑞文氏标准推理测试中脱颖而出。

Ken Forbus教授认为类比推理是解决视觉问题的核心,团队正是在这一核心思想的指导下研发了最新的计算模型。所谓类比推理即结构映射的过程,是在不同对象之间通过逐个匹配,寻找它们在结构上的相似点,从而通过图式归纳(即关系结构表征)把源问题中元素之间的关系要素提取出来,用于靶问题的解决。也就是说,先要形成基于源问题的图式归纳,再基于源问题和靶问题之间的结构映射将图式归纳应用到靶问题的解决。在新的计算模型中,团队成员利用了结构映射理论来对比不同的图像,通过标记两张图像中发现的相同结构,识别出其中的相同点和不同点。值得一提的是,结构映射是由心理学家Dedre Gentner于1983年提出的一个理论,他也是西北大学的教授。

针对西北大学的这项研究,雷锋网随机采访了两位相关专业的在读研究生,他们表达了自己的看法。

钟超杰是来自北京林业大学的硕士在读生,曾参与车载摄像头的行人检测项目。他认为,虽然模型的智力测试成绩超过了75%的人类,但这并不能说明计算机的智力真的就超过了人类。因为除了推理之外,智力的含义应该更复杂,比如还包括学习能力、数学计算能力等。而且他觉得如果模型建的好,经过一定数据量的训练,计算机处理这类问题的能力一般是可以超过人类的,但超出这类问题的范畴应该就不行了。

周志敏是来自浙江大学的研二在读生,了解机器学习领域的各种算法,包括svm、神经网络等。他认为这是人工智能针对特定任务的又一项成功应用,跟人类的类比、推理能力并不一样。西北大学的模型之所以表现出超过75%普通民众的推理能力,是因为它经过了大量的类似数据的训练,如果让它做图形之外的工作应该就不行了。

当前,人工智能系统对图像和语音的识别能力已经相当出色,但对于语义和图像含义的理解、推理能力仍有待提高。西北大学的团队表示,在许多场景中除了对源数据进行识别之外,对其含义的推理和解释也至关重要,这也是他们研发全新的计算模型并对其展开瑞文氏标准推理测试的原因。他们希望这项研究成果可以为计算机视觉领域今后的发展提供一些技术参考。

PS. 你觉得开头的测试题应该选哪个答案?不妨留言告诉我们吧。

via tomshardware

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-01-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

业界 | 黄仁勋亲自撰文怼上 TPU:P40速度比你快 2 倍,带宽是你的 10 倍

AI科技评论按:前不久谷歌发布了关于TPU细节的论文,称“TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍”。当时就有人对此种“比较”表示质...

3396
来自专栏AI科技大本营的专栏

美团大脑:知识图谱的建模方法及其应用 | 公开课笔记

作为人工智能时代最重要的知识表示方式之一,知识图谱能够打破不同场景下的数据隔离,为搜索、推荐、问答、解释与决策等应用提供基础支撑。

772
来自专栏机器之心

人工智能能骗过人类吗?愚人节特写:这不是玩笑

机器之心原创 作者:吴攀 人类自开始认识自己以来,大概就一直在梦想着能创造能与自己别无二致的存在(从偃师献给周穆王的歌舞艺伎到弗兰肯斯坦的怪物再到近段时间以来越...

3479
来自专栏PPV课数据科学社区

当今世界最NB的25位大数据科学家

引言 在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影...

4265
来自专栏ATYUN订阅号

【学术】量子算法与计算机对抗,胜者究竟是谁?

我们对“量子霸权(quantum supremacy)”的追求证明了量子计算机比普通计算机能够更快地做一些事情,但是,却自相矛盾地导致了准量子典型算法的繁荣。 ...

3144
来自专栏吉浦迅科技

对话二三事:微软公司语言辨识技术创新纪录

微软Microsoft的研究人员创造了语言辨识的世界纪录,该公司推出的最新科技,采用GPU加速深度学习技术,辨识对话中的字句,几乎达到等同于人类的准确率。 研究...

3205
来自专栏机器之心

MIT研发出脑控机器人:可使用脑波为机器人纠错

选自news.mit.edu 作者:Adam Conner-Simons 机器之心编译 参与:微胖、晏奇、吴攀 MIT 研发出的反馈系统能够让人类操作者仅通过...

3296
来自专栏企鹅号快讯

谷歌再出黑科技!人工智能模拟的人声和真人几乎难以分辨

谷歌再出黑科技 用人工智能模拟出来的声音 几乎可以和真人以假乱真 在我们的印象中,机器的声音都是冰冷的电子音,虽然人类也一直致力于研究让机器“说人话”,但搞出来...

2236
来自专栏大数据文摘

临近春节你为什么打不到车?概率论来帮忙!

1512
来自专栏华章科技

【膜拜大神】当今世界最牛的25位顶尖大数据科学家

在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影响的数...

802

扫码关注云+社区