学界 | 两位AI考生今年走上高考考场,而且数学已经考及格了

2017年高考今天就结束了,跟往年一样的是作文题目出来以后引发网友吐槽和创作、交警组织送考车队、以及帮迷路和丢失准考证的考生及时赴考。不一样的也有,那就是来自清华大学苏州研究院的高考机器人AI-MATHS和来自教育机构“学霸君”的智慧教育机器人Aidam,它们都通过数学试卷和人类一绝高下。

考试结果是,AI-MATHS在2017文科数学北京卷获得105分,在2017文科数学全国卷II获得100分;Aidam在2017文科数学全国卷获得134分,不过它需要人工为机器人输入题目,审题难度大大降低了。

下面 AI 科技评论就来详细聊一聊他们两位都是什么情况。

AI-MATHS在成都高新区一个会议室里独自答题
Aidam在北京与6位2016年高考理科状元同台竞技

AI-MATHS是什么来头?

2015年,科技部公布了国家高新技术研究发展计划(863计划)信息技术领域2015年第一批项目,科大讯飞股份有限公司牵头的“基于大数据的类人智能关键技术与系统”项目获得立项支持,安排863计划专项经费概算超5000万元,“高考机器人”就是项目中的重要研究目标之一。科大讯飞作为牵头单位,联合清华大学、中科院自动化所、北京大学、北京理工大学、中科院软件所、南京大学、电子科技大学、哈尔滨工业大学等超过30家科研院校和企业共同负责项目的研发与实施,科大讯飞执行总裁胡郁任项目的首席科学家。整个项目分成了许多不同的子项目,比如有专门做语文的、做数学的,科大讯飞除了牵头之外还要提供一些底层的平台技术给大家分享,还要设计测试方法和测试平台对每个子项目成果进行评估。

据 AI 科技评论了解,今年应试数学的成都AI-MATHS团队就是国家863类人答题项目组成员,主要负责攻关数学学科。 “AI-MATHS”之父林辉是清华大学苏研院大数据处理中心主任,同时也是该中心智慧教育事业部从2013年开始技术孵化的成都准星云学科技有限公司CEO。除了这次应试数学的AI-MATHS机器人,准星云学还研发了准星智能评测机器人(即准星智能评测系统),能对学生答案正误、错误知识点、错误原因进行智能判定。准星云学还亮相2016年“十二五”科技创新成就展并获得荣誉证书。

高耸的AI-MATHS

AI-MATHS诞生于2014年,于去年5月宣布参加高考,今年2月以较高分通过中期评测。林辉介绍,AI-MATHS是通过综合逻辑推理平台来解题,而非学习储存题库。“它可以学习小学到高中的7000多个考点,运算量可达2的800次方。”

“AI这次是系统阶段性成功公开测试,由于此次活动无法与高考同时同台进行,所以命名为模拟高考,但最关键的是整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开透明测试。”林辉介绍,近1年多来,AI在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关,“AI是通过综合逻辑推理平台来解题,而非学习储存题库,因此在完全掐断题库、断网、无人干涉、仅有12台服务器、1.2万道题的小样本训练量的诸多限制下,在今年2月时取得了93分的成绩。”

工作人员展示AI-MATHS两张卷子的评分

昨日傍晚6点,离2017年全国高考数学科目的考试结束只有1个小时,AI在位于成都高新区天府新谷一个关闭外部网络的房间内,通过内部服务器的计算,在2小时内作答两份高考数学试题,之后由教师批改答卷。

经过共2小时的解题、等待、评分后,AI-MATHS此次模拟高考成绩为:2017年高考文科数学北京卷获得105分,用时22分钟;2017年高考文科数学全国卷II获得100分,用时10分钟。2份考卷对比2月中期评测的基础上均有大幅提升。相比试前林辉110的目标,差距已经很小了;而这个答题速度则是人类根本无法比拟的。

值得一提的是,这款机器人目前仍有一些漏洞需要不断改进,比如,AI-MATHS欠缺对常识的理解能力,这导致AI-MATHS不能理解一些题目,在解答题中有0分答案的出现。这次挑战的结果将运用到该公司对AI-MATHS的技术验证和准星产品迭代中。“此后AI-MATHS将接受大样本训练、测验弹性扩展能力,乃至于迁移到其他领域的学习能力。”林辉说。

“学霸君”的三岁女儿Aidam

昨晚在北京,教育机构“学霸君”请到6名去年的理科状元来和他们的智能教育机器人Aidam进行同台对决,共同解答今年高考文科数学试题。

六名高考状元在高考数学结束拿到试题后,立即开始答题,答题时间是五十五分钟。人机双方分别完成了包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。经过数学特级老师、奥赛教练韩兆勇的评审,Aidam的分数最终公布:134 分。三组高考状元陪他一起进行测试,状元一组得分119分。状元二组得分140分。状元三组得分146分。

三组高考状元平均分135分,Aidam与平均分只差一分,但是离最好成绩还有一段距离。另外据雷锋网 AI 科技评论了解,现场是人工为机器人Aidam输入题目的,这将会导致难度大大降低,因为直接跳过了审题、提取信息这一解题过程中非常重要、也很有难度的一步。所以Aidam的通用性比AI-MATHS要差一些,离我们理想中严格断网、断库、自然语言理解的答题机器人也要更远一点。

不过学霸君的思路强调大题库(已经有超过7000万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识组件和解题模式。

相比高考状元们花了将近一个小时才完成考试,Aidam仅仅在10分钟内就完成了所有的答题。学霸君创始人张凯磊坦言自己很紧张,“就像送自己的女儿参加高考”。他表示,为了展示,Aidam昨天答题放慢六倍速度,平时每道题完成时间应该在七至十五秒。

Aidam解题全程展示

Aidam放慢的原因是不仅需要把题目做对,还需要给大家展示他是如何做到的。根据要求,Aidam会通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。

参加了昨晚对决的2016年河北省理科状元孟祥熙现就读于北京大学光华管理学院,他受访时表示,“人机大战赢了很开心,但是机器人技术很先进,想知道自己解题错在哪里”。

“想知道自己解题错在哪里”正是学霸君想要帮学生达到的重要目标之一。

学霸君是一家以技术为驱动的创业公司,自成立之初就一直致力于人工智能服务教育领域的探索,目标是通过机器理解为老师和学生在薄弱知识点的学习提供丰富的支持。学霸君潜心研究的智能教育机器人就是机器理解技术的一种典型应用,也是人工智能领域的重要挑战。学霸君推出的同名手机app就在为学生和老师提供着解题、答疑相关服务。

为什么研发高考机器人

作为863“高考机器人”项目的“领头羊”,科大讯飞认为,研发“高考机器人”的主要目标并不是PK掉人类考生,而是为了更好地服务人类,利用相关技术成果可以在教育全过程中起到非常大的帮助,技术和算法的突破后,同样的成果可以用在医疗、用在客服、用在越来越多的领域。

“像在客服系统、还有一些车载的人机交互系统里,都需要我们预先对一些行业知识的理解,同时基于这个理解的结果能够做一些决策判断、一些相关问题的回复。”科大讯飞轮值总裁吴晓如介绍说,“现在,我们已有一些中间技术应用到一些行业里面了,比如说教育领域中作文的自动阅卷;还有机器翻译这块,我们已经推出了相关的口语对口语的翻译系统。所以,虽然现在我们还没有向社会公布我们这个系统在高考中的最后得分,我们在不同的行业里面已经形成了一些应用。”

根据吴晓如介绍,在研究中除了答题,讯飞的高考机器人还有阅卷的功能。应用在大学的普通话等级测试时,他们请了一组最权威的专家留下了很多测试样本,以这些测试样本作为机器学习的对象,然后建立模型来测试。最后的结果是,一组21个人的平均分,机器和专家的丝毫不差;分数排序的相关性也很高。以后作文阅卷也可能交给机器。

在科大讯飞研究院院长胡国平看来,高考机器人战略也将是中国人工智能实现“弯道超车”的一个助推器,同时,巨大的应用市场、高水平的人力资源将确保中国在人工智能发挥实效上前途无限。“我们的高考机器人从开始的时候就已经很清楚,我们的目标就是高考,而且是中国的高考。实际上,和东京大学自主命题的考试一样,难度是非常大的。我们一开始就是奔着这个真正有难度的任务去努力的,所以换个角度来说,中国在整个人工智能领域特别在内容智能领域持续领先的可能性会更大。”胡国平对整个高考机器人项目表示了信心。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

特写|人工智能背后的人

机器之心原创 作者:虞喵喵 在大部分人看来,人工智能是个有些「科幻」的词汇,代表小说电影中和人类长相相似、或温柔或冷酷的机器人。 稍微熟悉一点,这份印象又变成冷...

2978
来自专栏华章科技

高盛CEO:没有足够背景的孩子如何逆袭

世界上最大的投资银行高盛集团CEO,贝兰克梵因带领高盛集团成功走出2008年金融危机而为人所熟知。贝兰克梵1954年出生于纽约布鲁克林的一个贫民区,父亲是一个普...

482
来自专栏腾讯研究院的专栏

数字时代,如何夺回涣散的注意力?

撰文:Jacob Weisberg 翻译:陶小路  《东方历史评论》 1 “手上没活的时候我们抽烟;不想问题的时候我们读《时代周刊》,”麦克唐纳...

3374
来自专栏PPV课数据科学社区

IT桔子:在线教育&大数据学习社区(附PDF下载)

大家好! 首先非常感谢IT桔子提供这么好的分享平台,我是PPV课的创始人江海涛。 今天这个场景我非常的熟悉,大概2年前,也是在深圳某一个咖啡厅里面,当时站在这个...

3497
来自专栏罗超频道

技术神贴:金山电池医生负责人谈Tesla电池

最近雷司令送给我们傅老板的Tesla到货了,老板开恩,所有员工都可以报名试驾。我也High了一把。 我是金山电池医生的产品负责人,也是一个超级电池迷,所以,其...

2834
来自专栏架构说

大牛故事-技术变现

程序员用自己的技术变现,其实是一件天经地义的事儿。写程序是一门“手艺活儿”,那么作为手艺人,程序员当然可以做到靠自己的手艺和技能养活自己。 然而,现在很多手艺...

2867
来自专栏镁客网

智能玩具机器人Cozmo的背后:Anki如何打造这一现象级项目?

1814
来自专栏带你撸出一手好代码

论女程序员的重要性

在互联网挨踢行业, 搞技术的人群中,男性从业者的数量是以压倒性的优势胜过女性从业者, 多年来本司机一直在思考这个问题, 倒底是什么原因导致这样的现状? 有的人认...

3417
来自专栏大数据钻研

谁说程序员干到35就不行了?

程序员干到35就不行了!   IT行业普遍存在这种说法, 而且还有各种年龄版本, 有的说到30岁;有的说到35岁;有的说到40岁, 达到这个年龄上限就必须要调整...

3046
来自专栏PPV课数据科学社区

【经验】数据告诉你:提高效率就别做这7件事

作者丨CamMiPham译者丨SherryMoon 当我17岁时,常常一天工作学习20小时左右。我利用课间完成作业,晚上则去管理一个公益组织。那时付出的努力给了...

3459

扫描关注云+社区