学界 | 两位AI考生今年走上高考考场,而且数学已经考及格了

2017年高考今天就结束了,跟往年一样的是作文题目出来以后引发网友吐槽和创作、交警组织送考车队、以及帮迷路和丢失准考证的考生及时赴考。不一样的也有,那就是来自清华大学苏州研究院的高考机器人AI-MATHS和来自教育机构“学霸君”的智慧教育机器人Aidam,它们都通过数学试卷和人类一绝高下。

考试结果是,AI-MATHS在2017文科数学北京卷获得105分,在2017文科数学全国卷II获得100分;Aidam在2017文科数学全国卷获得134分,不过它需要人工为机器人输入题目,审题难度大大降低了。

下面 AI 科技评论就来详细聊一聊他们两位都是什么情况。

AI-MATHS在成都高新区一个会议室里独自答题
Aidam在北京与6位2016年高考理科状元同台竞技

AI-MATHS是什么来头?

2015年,科技部公布了国家高新技术研究发展计划(863计划)信息技术领域2015年第一批项目,科大讯飞股份有限公司牵头的“基于大数据的类人智能关键技术与系统”项目获得立项支持,安排863计划专项经费概算超5000万元,“高考机器人”就是项目中的重要研究目标之一。科大讯飞作为牵头单位,联合清华大学、中科院自动化所、北京大学、北京理工大学、中科院软件所、南京大学、电子科技大学、哈尔滨工业大学等超过30家科研院校和企业共同负责项目的研发与实施,科大讯飞执行总裁胡郁任项目的首席科学家。整个项目分成了许多不同的子项目,比如有专门做语文的、做数学的,科大讯飞除了牵头之外还要提供一些底层的平台技术给大家分享,还要设计测试方法和测试平台对每个子项目成果进行评估。

据 AI 科技评论了解,今年应试数学的成都AI-MATHS团队就是国家863类人答题项目组成员,主要负责攻关数学学科。 “AI-MATHS”之父林辉是清华大学苏研院大数据处理中心主任,同时也是该中心智慧教育事业部从2013年开始技术孵化的成都准星云学科技有限公司CEO。除了这次应试数学的AI-MATHS机器人,准星云学还研发了准星智能评测机器人(即准星智能评测系统),能对学生答案正误、错误知识点、错误原因进行智能判定。准星云学还亮相2016年“十二五”科技创新成就展并获得荣誉证书。

高耸的AI-MATHS

AI-MATHS诞生于2014年,于去年5月宣布参加高考,今年2月以较高分通过中期评测。林辉介绍,AI-MATHS是通过综合逻辑推理平台来解题,而非学习储存题库。“它可以学习小学到高中的7000多个考点,运算量可达2的800次方。”

“AI这次是系统阶段性成功公开测试,由于此次活动无法与高考同时同台进行,所以命名为模拟高考,但最关键的是整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。”林辉介绍,近1年多来,AI在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关,“AI是通过综合逻辑推理平台来解题,而非学习储存题库,因此在完全掐断题库、断网、无人干涉、仅有12台服务器、1.2万道题的小样本训练量的诸多限制下,在今年2月时取得了93分的成绩。”

工作人员展示AI-MATHS两张卷子的评分

昨日傍晚6点,离2017年全国高考数学科目的考试结束只有1个小时,AI在位于成都高新区天府新谷一个关闭外部网络的房间内,通过内部服务器的计算,在2小时内作答两份高考数学试题,之后由教师批改答卷。

经过共2小时的解题、等待、评分后,AI-MATHS此次模拟高考成绩为:2017年高考文科数学北京卷获得105分,用时22分钟;2017年高考文科数学全国卷II获得100分,用时10分钟。2份考卷对比2月中期评测的基础上均有大幅提升。相比试前林辉110的目标,差距已经很小了;而这个答题速度则是人类根本无法比拟的。

值得一提的是,这款机器人目前仍有一些漏洞需要不断改进,比如,AI-MATHS欠缺对常识的理解能力,这导致AI-MATHS不能理解一些题目,在解答题中有0分答案的出现。这次挑战的结果将运用到该公司对AI-MATHS的技术验证和准星产品迭代中。“此后AI-MATHS将接受大样本训练、测验弹性扩展能力,乃至于迁移到其他领域的学习能力。”林辉说。

“学霸君”的三岁女儿Aidam

昨晚在北京,教育机构“学霸君”请到6名去年的理科状元来和他们的智能教育机器人Aidam进行同台对决,共同解答今年高考文科数学试题。

六名高考状元在高考数学结束拿到试题后,立即开始答题,答题时间是五十五分钟。人机双方分别完成了包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。经过数学特级老师、奥赛教练韩兆勇的评审,Aidam的分数最终公布:134 分。三组高考状元陪他一起进行测试,状元一组得分119分。状元二组得分140分。状元三组得分146分。

三组高考状元平均分135分,Aidam与平均分只差一分,但是离最好成绩还有一段距离。另外据雷锋网 AI 科技评论了解,现场是人工为机器人Aidam输入题目的,这将会导致难度大大降低,因为直接跳过了审题、提取信息这一解题过程中非常重要、也很有难度的一步。所以Aidam的通用性比AI-MATHS要差一些,离我们理想中严格断网、断库、自然语言理解的答题机器人也要更远一点。

不过学霸君的思路强调大题库(已经有超过7000万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识组件和解题模式。

相比高考状元们花了将近一个小时才完成考试,Aidam仅仅在10分钟内就完成了所有的答题。学霸君创始人张凯磊坦言自己很紧张,“就像送自己的女儿参加高考”。他表示,为了展示,Aidam昨天答题放慢六倍速度,平时每道题完成时间应该在七至十五秒。

Aidam解题全程展示

Aidam放慢的原因是不仅需要把题目做对,还需要给大家展示他是如何做到的。根据要求,Aidam会通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。

参加了昨晚对决的2016年河北省理科状元孟祥熙现就读于北京大学光华管理学院,他受访时表示,“人机大战赢了很开心,但是机器人技术很先进,想知道自己解题错在哪里”。

“想知道自己解题错在哪里”正是学霸君想要帮学生达到的重要目标之一。

学霸君是一家以技术为驱动的创业公司,自成立之初就一直致力于人工智能服务教育领域的探索,目标是通过机器理解为老师和学生在薄弱知识点的学习提供丰富的支持。学霸君潜心研究的智能教育机器人就是机器理解技术的一种典型应用,也是人工智能领域的重要挑战。学霸君推出的同名手机app就在为学生和老师提供着解题、答疑相关服务。

为什么研发高考机器人

作为863“高考机器人”项目的“领头羊”,科大讯飞认为,研发“高考机器人”的主要目标并不是PK掉人类考生,而是为了更好地服务人类,利用相关技术成果可以在教育全过程中起到非常大的帮助,技术和算法的突破后,同样的成果可以用在医疗、用在客服、用在越来越多的领域。

“像在客服系统、还有一些车载的人机交互系统里,都需要我们预先对一些行业知识的理解,同时基于这个理解的结果能够做一些决策判断、一些相关问题的回复。”科大讯飞轮值总裁吴晓如介绍说,“现在,我们已有一些中间技术应用到一些行业里面了,比如说教育领域中作文的自动阅卷;还有机器翻译这块,我们已经推出了相关的口语对口语的翻译系统。所以,虽然现在我们还没有向社会公布我们这个系统在高考中的最后得分,我们在不同的行业里面已经形成了一些应用。”

根据吴晓如介绍,在研究中除了答题,讯飞的高考机器人还有阅卷的功能。应用在大学的普通话等级测试时,他们请了一组最权威的专家留下了很多测试样本,以这些测试样本作为机器学习的对象,然后建立模型来测试。最后的结果是,一组21个人的平均分,机器和专家的丝毫不差;分数排序的相关性也很高。以后作文阅卷也可能交给机器。

在科大讯飞研究院院长胡国平看来,高考机器人战略也将是中国人工智能实现“弯道超车”的一个助推器,同时,巨大的应用市场、高水平的人力资源将确保中国在人工智能发挥实效上前途无限。“我们的高考机器人从开始的时候就已经很清楚,我们的目标就是高考,而且是中国的高考。实际上,和东京大学自主命题的考试一样,难度是非常大的。我们一开始就是奔着这个真正有难度的任务去努力的,所以换个角度来说,中国在整个人工智能领域特别在内容智能领域持续领先的可能性会更大。”胡国平对整个高考机器人项目表示了信心。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏分享达人秀

那些奇葩的面试!为什么我会拒绝这些公司的邀请?

? 昨天,跳槽大师的顾问跑来问我,之前给我推荐了十来家公司,都去面试了吗?我说,太多奇葩,只面了4家,已经拿到2个Offer。看在顾问们一周帮我拿到...

4464
来自专栏机器之心

机器之心专访腾讯「绝艺」团队负责人:用全新强化学习方法造就更强模型

机器之心原创 作者:李泽南、吴攀 3 月 19 日,在全部由人工智能参加的 UEC 杯世界围棋大赛中,绝艺战胜了所有对手。据介绍,在本次比赛结束后,腾讯 AI ...

3549
来自专栏AI研习社

特辑 | 站在学术大牛的肩膀上,看2017年的AI圈

在刚刚过去的 2017 年,国内外人工智能界的突破层出不穷:在自然语言处理和计算机视觉领域,国内发展势头迅猛,在人工智能最前沿研究上,国外独领风骚。 2 月初,...

3369
来自专栏目标检测和深度学习

这样学,你也和世界一流大学的学生一!样!

741
来自专栏机器人网

电气电子工程师职业前途问题的15个反思

我经过同电气工程师朋友们的真诚交流,长时间的深刻思考电气工程师一直纠结于心中的难题,提取了15个电气工程师最关心的问题,并做了浅显的分析,写得不当之处,还望能得...

3299
来自专栏理论坞

2017英国封面设计学院奖获奖作品,能学几招是几招

从 2014 年开始,书籍封面设计师 Jon Gary 和 Jamie Keenan 开始举办英国封面设计学院奖(The Academy of British ...

933
来自专栏Java架构解析

程序员的而立之年,迷茫之年

每天按点上班,到点下班,时不时再加加班,空闲时候就看看书、写写博客、拜访朋友、玩会游戏。

80
来自专栏编程坑太多

程序员被沦陷!国内程序员真的饱和了?

1364
来自专栏新智元

Let’s Go : 围棋的诱惑与智力的边界

所谓的“人机世纪大战”,谷歌的AlphaGo与南韩李世石的对决即将上演,这不但让我想起差不多20年前IBM“深蓝”与卡斯帕罗夫的国际象棋比赛,也被许多人称为是“...

2776
来自专栏大数据文摘

每个人都在使用LSTM,主流学术圈却只想让它的发明者闭嘴

1864

扫码关注云+社区