Aristo | 智能程序参加美国四年级考试

人工智能软件参加真正的学校考试也许是机器学习常识一条捷径。

兔子的毛在哪个季节最厚实?一个叫做 Aristo 的电脑程序能告诉你答案,因为 Aristo 从四年级的书上学到熊在冬天会长出更加厚实的皮毛,而且 Aristo 还从纽约州标准科学考试上学到了兔子也是哺乳动物,由此 Aristo 能够得到正确的答案。

Aristo 由西雅图艾伦人工智能研究所研发,是一款能够感知人类社会常识的人工智能软件。而衡量它效果最好的方式,就是用适用于学龄儿童的测试来进行检测。该研究所还在说服其他的 AI 研究人员,发展一种标准,测试他们的成果。

这种标准的目的,是把 AI 和对自然语言研究的发展,用一种客观的方式表现出来,通过比较不同方法的优缺点,有助于我们更快找到最有效的方法从而加快 AI 的发展。

11 月上旬,艾伦研究所将会发起一项挑战,让研究人员研发出能做八年级(相当于初二)理科试题的智能软件。这个竞赛在科学竞赛网站 Kaggle 上正火热进行中,参赛人员可以通过千万道问题来训练他们的软件。如果一个软件能够解决出一道它从未见过的问题,并得分最高的话,研发者将会获得 50,000 美元的奖金。

现在 Aristo 距离做出四年级的理科测试,还有很大一段距离。它只能做多项选择,而多项选择占了测试的 2/3。如果选择题中不涉及图形题的话,Aristo 能做对 75%,如果有图形题的话就只能做对 45%,而及格需要至少 65 分。Aristo 在做不含有图形题的八年级理科测试多项选择时,能得 63 分。你可以在艾伦研究所网站上,看到 Aristo 回答某些经过选择的问题。这个软件能够应用合理的计算法则,并通过网站上看到的学习指南,来回答这些问题。

在 AI 领域,想把哪怕一丁丁点常识塞进软件都是一个巨大挑战,但是一旦实现,电脑就能进一步以前所未有的方式帮助提高我们的生活。如果我们想研发出更加强大的系统来协助工作,那学习常识将是这些系统所必需的能力。其他的顶尖的研究人员也同意这一看法,这其中就包括 Facebook 的 AI 实验室,它正致力于使网络虚拟助手具备一些基本的谈话能力。目前市面上虚拟助手不具备常识,比如苹果的 Siri 以及微软的 Cortana。他们只是根据你所说的,从一个预编程的规则中选择回复。

为机器学习常识的能力设定标准很有用,但也有人认为,学校测试不是个好法子。

适用于孩子的测试可以确保研究人员不会有意,或无意地把这个领域的发展衡量标尺变得太“easy”,但是孩子们在探索世界方面可比机器软件强太多了,为孩子们编写的试题不能来做为衡量智能软件的发展的标尺。机器和人类所不擅长的事物是非常不一样的,适于人类的标准化测试,并不能很全面地覆盖机器软件所面临的难点问题。

更好的选择是专门为机器软件拟一份试题。比如这样的测试题:Sally 最心爱的奶牛昨天死掉了,奶牛可能会在多久之后复活?a)明天;b)一周以后;c)一年以后;d)几年后;e)奶牛再也不会复活了。这种题对于四年级学生而言就是非常简单的。

不过,尽管学校的测试题不会直接检测常识,但是却间接地要求具备这些常识。因为读懂这些问题就需要常识,只有采用适用于人类的测试题,我们才能说我们是以自己的标准在衡量机器软件。

只有人类和机器位于同一起跑线,这一切才有意义。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2015-09-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据小魔方

学习R语言我都做了哪些有趣的事情!!!

学习R语言已经整整一年光景了, 是时候整理一下自己学习以来的收获和成就。 虽然一直学的很专注(一直埋头在可视化的小圈子了,总感觉这样是停留在舒适区,也许外面的...

2774
来自专栏腾讯大讲堂的专栏

腾讯大讲堂走进新加坡南洋理工大学

腾讯大讲堂在9月18日走进新加坡南洋理工大学与师生分享微信背后的智能技术,以及如何更好应用智能技术开发移动应用。本次讲座作为首届在狮城新加坡鸣响战鼓“WeMag...

2549
来自专栏新智元

MIT教授称人类大脑并不比AI复杂,30年内机器智能将可复制爱与同情

【新智元导读】不久前,由IBM研发的AI辩论系统Project Dabater与人类辩论冠军进行了一场辩论,AI的表现令人印象深刻。从Project Debat...

966
来自专栏达摩兵的技术空间

如何区分管理

人员的能力肯定是不同的,那么对于不同的人肯定要区分管理。区分管理的重点就是先分析,后区分的分任务,区分的给奖励,区分的给压力和责任。

642
来自专栏新智元

荐读 | 除了会下棋的阿法狗,AI军团还有这44个知名项目

在科幻小说中,我们经常看到AI软件的身影,许多人认为AI是一门存在于未来的技术,也许会变成现实,也许永远会停留在空想之中。 事实并非如此,我们当中的大多数人每天...

34915
来自专栏Sign

精灵之息

游戏引导,只是这样简单的规则,居然要这么多字#这就是为什么Sign不喜欢制作新手引导的原因#

741
来自专栏BestSDK

为什么数据价值没法落地?因为你不懂他说的“话”

过去的IT时代我们只是简单的使用数据,很少为了解决问题而提炼过数据。为什么我要强调提炼过的数据?因为如果我们要让数据产生价值,让更贴身的数据分析框...

3404
来自专栏CDA数据分析师

从数据到价值——创业团队应该关注的四个阶段

这是一个最好的时代,移动互联网技术为从业者提供了无比丰富的数据。从人们的言行举止、社交关系、到地里位置无处不在。这些详细宝贵的数据,蕴含了巨大的价值!但是,这也...

17610
来自专栏数据的力量

读书也能收获工作经验吗?

我常常遇到这样的问题,我想考研,但考研读书是不是白白损失了三年工作经验积累的时间?

772
来自专栏镁客网

比人类更强大的不是人工智能,而是掌握了人工智能的人类 | 科大讯飞年度发布会重磅发布三大板块、十项产品

1650

扫码关注云+社区