机器人参加高考数学22分钟拿105分,究竟怎么做到的?

AI 研习社按:2017 年高考刚刚结束,据相关媒体报道,7 日下午,在没有网络和题库支持的情况下,一个名为 Al-Maths 的机器人在 22 分钟内完成了文科数学北京卷,并取得了 105 分的成绩(满分 150 分),一时引发了公众的普遍关注和讨论。本文将试着从数学解题思维的角度出发,对比机器学习的一般性认知逻辑,为大家揭秘高考机器人的内部工作原理。原文作者怒放的生命,原载于芥末堆,AI研习社已获授权。

最近频繁看到机器人参加高考的消息,学校教育培养的人才还不如一个机器的报道甚嚣,且尘上矣。笔者不才,从事十几年教学和教育技术研究,对机器人参加高考的宣传报道怎么兴趣荡然无存呢。

近期的一则报道说高考机器人数学成绩以93分收场,我们研究高考数学试卷可以知道基础分数为90分,也就是我们所说的”比着葫芦画瓢”也可以拿到90分,老师辅导高三学生备考的时候,经常给学生规范题型模板,只要是往里套公式,基本可以拿到这个比较低的分数,可以感觉目前机器学习是无穷对比的结果。借鉴计算机视觉理论创始人马尔的三级论定义,机器学习中关于数据的处理与分析,包含三个方面:

● 首先是应用问题导向,主要应用是已有的模型和方法解决一些实际问题,相当于数据挖掘; ● 其次是应用问题的需要,提出和发展模型、方法和算法以及研究支撑它的数学原理或者理论基础等,这是核心; ● 第三就是通过推理达到某种智能。数据挖掘接近于数据端,机器学习接近于智能端。

《高中数学课程标准》指出,高中数学应注意提高学生的数学思维能力,这是数学教育的基本目标之一。学生们在学习数学和运用数学解决问题时,不断地经历直观感知、观察发现、归纳类比、空间想象、抽象概括、符号表示、运算求解、数据处理、演绎证明、反思与建构等思维过程,数学思维能力在形成理性思维中发挥着独特的作用。

我谈一下学生学习知识的解题逻辑和思维经历。

数学题与数学解题

中学生接触最多的是狭义标准化上的数学题,说到标准包括两个基本要素:条件(已知条件,题干条件),结论(未知,求解,求证,求作)。解题就是沟通条件与结论之间的联系,包括解和解题依据。解题比做打仗,那么解题者的“兵力”就是数学基础知识,解题者的“兵器”就是数学基本方法,而调动数学基础知识、运用数学基本方法的数学解题学正是“兵法”。

数学解题的思维信息过程

《数学解题学引论》中认为数学解题的信息过程包括这样一个“三位一体”的工作。

1. 有用捕捉:从理解题意中捕捉有用的信息,主要是弄清条件是什么?结论是什么?如何建立条件与结论之间的逻辑联系?通过感知和以前学过的图示知识,从题目的叙述中获取“符号信息”,从题目图形中获取“形象信息”。知识与图示知识是“有用捕捉”的基础。

2. 有关提取:即在“有用捕捉”的刺激下,通过回想而从记忆储存中提取有关的信息,图示知识:定理、公式、基本模式、解题经验等解题依据或解题凭借。良好的认知结构和机智的策略选择是连续提取、不断捕捉的基础。

3. 有效组合:将“有用捕捉”和“有关提取”两组信息进行有效组合。逻辑思维能力是有效组合的基础,而“逻辑结构”是否有效,其基本要求应能说服自己、说服论敌。

这三个步骤往复循环,依信息的反馈而由大脑来调节,解题信息过程如图1所示:

从信息论的观点分析例1的解题过程,则是两个维度上相关信息的有效组合,即从理解题意中捕捉有用的信息,从记忆中提取有关的信息,并把这两组信息组成一个和谐的逻辑结构。

可见,数学解题的思维过程是一个“三位一体”的工作.

例1的分析充分体现了解题者的思维过程,也正是解题教学中教师应该向学生充分展示的过程。因为例1的难度不大,甚至还能“简单模仿”,但是很难让学生上升到“自发领悟”和“自觉分析”的顿悟层次,对提高学生解题能力起不了多大作用。

对解题方法与策略的认识

1)解题方法

这里说的解题方法,是指中学阶段用于解答数学题的方法。此处将其分为3类,分别为具有创立学科功能的方法,体现一般思维规律的方法,具体进行论证演算的方法。

1. 具有创立学科功能的方法。如公理化方法、模型化方法、化归方法、结构化方法,以及集合论方法、极限方法、坐标方法、向量方法等。在具体解题中,具有统率全局的作用。

2. 体现一般思维规律的方法。如观察、试验、比较、分类、猜想、类比、联想、归纳、演绎、分析、综合等。在具体解题中,有通理通法、适应面广的特征,常用于解题思路的探求。

3. 具体进行论证演算的方法。这又可以依其适应面分为两个层次,第一层次是适应面较广的求解方法,如消元法、换元法、降次法、待定系数法、反证法、同一法、数学归纳法(及递推法)、坐标法、三角法、数形结合法、构造法、配方法等;第二层次是适应面较窄的求解技巧,如因式分解中的“裂项法”,函数作图中的“描点法”,以及三角函数作图中的“五点法”,几何证明中的“截长补短法”、“补形法”,数列求和中的“裂项相消法”“倒序求和”“错位相减法”等。

仅仅是不等式的证明,我们就可以列举出一长串的解法或技巧:比较法、放缩法、综合法、分析法、递推法、反证法、基本不等式法、叠加法、连乘法、数学归纳法、判别式法、求极值法、配方法、辅助函数法、构造法、微分法等,而微分法又可以有求极值、确定单调性、中值定理等形式。

2) 解题策略

注重解题策略的研究已经构成中国解题的一个特色,它可以看成是对波利亚现代启发性解题策略研究的继承与发展,徐利治教授提出的RMI原理是这方面工作的杰出代表。

1. 策略是指导行动的方针,同时也是增强效果、提高效率的艺术,它区别于具体的途径或方式。数学解题的策略是为了实现解题目标而采取的方针。解题策略的思维基础是逻辑思维、形象思维、直觉思维的共同作用,离开逻辑是不行的,单靠逻辑是不够的。

2. 解题策略介于具体的求解方法与抽象的解题思想之间,是思想转化为操作的桥梁,一方面它是用来具体指导解题的方法,另一方面它又是运用解题方法的方法、寻找解题方法的方法、创造解题方法的方法。

如果把解题策略理解为选择与组合的一系列规则,那么这些规则应该具有迅速找到较优解题操作的基本功能,能够减少尝试或失败的次数,能够节省探索的时间和缩短解题的长度,体现出选择的机智和组合的艺术。

总之解题思维是来自身体经验的,并非来自语言和文字标签,语言也是来自身体经验的。但是智力越发展,语言的重要性也越大。

假如例1题变式为:向量OA坐标为(3,4),按照逆时针方向旋转135°到向量OB,求B点坐标。

按照三位一体的思维理论,学生很容易通过向量和两角和与差的余弦定理去建立解题逻辑。而机器人的所谓神经网络学习模式攫取的底层标签都是向量相关的,解题逻辑的建立就太难了。

机器学习的认知逻辑是如果涉及“认知发生”,各种导图、图谱统统都是无效的。不涉及“认知发生”时,图谱、导图在一些教学场景下能提供仅仅部分有效的支持。比如:“认知发生”是指“你不能想象吃米饭的动作,你就无法理解啥叫吃米饭”。也即:如果要让学生理解“吃米饭”这一逻辑的前提是,学生能想象“吃米饭动作”这一身体经验。当我们没有直接的“吃米饭”的经验,但是有“吃”的经验以及“大米”的经验时,语言可以协助我们想象“吃米饭”的经验。这种“概念拼装”可能会有部分的“失真”,但确实是可以促进的。这也就是“教”的意义。在复杂认知技能的有效学习方面,模拟任务环境中的重要性,心理逼真度>功能逼真度>物理逼真度。

学习分析数据模型

高考机器人意在通过整合最先进的人工智能技术,检验人工智能可在多大程度上模拟人类思考以及解决问题的能力,希望用自适应的方式帮助K12阶段的学生学习。有些公司通过手机App的拍照搜题,在线一对一等多种渠道进行数据收集,这些数据包含学生在做题、考试等应用场景中的种种行为表现,充其量是记忆平台用来检测,而非创造性思维。对此,有业内人士表示,高考机器人能在多大程度上落地值得商榷,像有的互联网巨头也在投入巨额资金做人工智能,但是离社会化应用和行业应用还有很长的路要走。更不要借用“高考机器人”和机器人可以考上一本的噱头去迎合部分人心理,机器短期内适应不了原创题高考的选拔性考试。

参考文献

感谢北京大学概率统计系张志华教授、常象宇博士论文资料等等。

统计制度《机器学习:统计与计算之恋》《中国计算机学会通讯》

《教育数据挖掘》2012年12月出版,张少刚,魏顺平博士

《深度学习的7种有力策略》(美)艾瑞克尼克尔森

研习社特供福利 ID:OKweiwu

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2017-06-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏牛客网

百度阿里头条算法面经

最近秋招很多消息和内推都是通过牛客获得的,回馈一下发一波面经,希望能帮到大家~ 楼主华五本科海外硕士,一份美国大厂数据挖掘实习,没有相关领域的paper,投的都...

40430
来自专栏大数据挖掘DT机器学习

如何用 Python 攻克「最强大脑」

最强大脑之【七阶立方密码】 在 2018 年《最强大脑之燃烧吧大脑》节目中,来自清华大学的杨易和来自北京大学的 刘宇进行了个人淘汰赛,两个人所要挑战的项目是“七...

58670
来自专栏AI研习社

Google Brain:NMT训练成本太高?用大规模神经机器翻译架构分析给出解决方案

编者按:十年前,Google Translate发布。当时,这项服务背后的核心算法还是基于短语的机器翻译。 而十年后的今天,更先进的神经网络机器翻译( Neur...

35350
来自专栏AI科技评论

开发 | NMT训练成本太高?Google Brain用大规模神经机器翻译架构分析给出解决方案

AI科技评论编者按:十年前,Google Translate发布。当时,这项服务背后的核心算法还是基于短语的机器翻译。 而十年后的今天,更先进的神经网络机器翻译...

370100
来自专栏带你撸出一手好代码

当年学正则的来龙去脉,希望对正则有兴趣的同学能从中获得灵感

当年零基础入行, 什么都不会, 所幸有万能的搜索引擎(那时候谷歌还没被墙在外面),碰到问题都可以在上面找到答案。 然而, 当碰到正则匹配字符串相关的问题时, 搜...

35060
来自专栏Vamei实验室

概率论08 随机变量的函数

随机变量的函数 在前面的文章中,我先将概率值分配给各个事件,得到事件的概率分布。 通过事件与随机变量的映射,让事件“数值化”,事件的概率值转移到随机变量上,获得...

206100
来自专栏WOLFRAM

以Mathematica为工具的“π”教学案例

20350
来自专栏PPV课数据科学社区

会学习!会写字!这个机器人太牛了!

最近,《科学》杂志封面刊登了一篇重磅研究:人工智能终于能像人类一样学习,并通过了图灵测试。 这个人工智能像你一样学习写字 假设你从来没有见过菠萝。有一天,有人...

424110
来自专栏CSDN技术头条

【问底】严澜:数据挖掘入门——分词

谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成...

20890
来自专栏ACM算法日常

浅谈ACM算法学习与有效训练

一、什么是有效地训练?   很多ACMer入门的时候,都被告知:要多做题,做500多道就变牛了。其实,这既不是充分条件、也不会是必要条件。   我觉得一般情...

11720

扫码关注云+社区

领取腾讯云代金券