机器学习之父 Tom Mitchell:人工智能如何跟智适应学习相互联系

点击火柴盒观察,连接新教育产业

本文共5530字阅读约13分钟

11月16日,在雷锋网联合乂学教育松鼠AI举办的“全球AI+智适应教育峰会”上全球公认机器学习之父Tom Mitchell发表了演讲。

以下为他的演讲内容,经i黑马&火柴盒整理编辑:

Tom Mitchell:非常感谢,首先我要感谢本次会议的主办方,让我们今天有机会来到这里。我要告诉大家一件事,我觉得智适应学习以及相关的教学一直都在发展,但是我最近10年是最好的10年。因为在最近10年我们开始看到了这些技术更加成熟,公司也开始运用这些技术,所以我觉得尤其今年是我们这个领域的转折点,今天的各位观众会发明新一代智适应学习的技术。

今天要跟大家分享一下我的想法,跟大家谈一谈人工智能以及人工智能如何跟智适应学习相互联系。智适应有个体系,在体系当中老师会不断评估学生的能力,会发现学生的不足点,给他们设立目标,会发现学生学习的需求,根据学生的学习速度给他们一些更好的建议。

我们发现有些系统已经开始做这件事情了,但是他们都处于早期阶段,我们接下来会做更多的工作来改善这个系统。今天要跟大家讲机器学习以及人工智能,它们会是智适应学习当中的一种驱动式的技术。

我们仔细的来看一下,当前机器学习在过去10年发展得非常快,所以过去10年在计算机视觉方面AI刚开始做得不是特别好,但是后来它的识别精度就非常高了,几乎跟人眼一样。自2010年以来计算机视觉的精确度非常高,有个人和机器识别的对比,准确率非常接近,机器学习的速度非常快。在语音学习方面的发展速度也非常快,还有在围棋方面,AI已经打败了世界冠军,还有在机器人汽车方面我们也会有很多无人驾驶汽车跟机器人的结合。

所以展望未来,我们可以提出这样的机器学习如何会促进AI的发展,促进智适应促进智适应学习的发展呢?我觉得有三个问题值得我们讨论:

1.机器应该学习什么?

今天或者昨天我们做了很多有益的讨论和探讨,我们要有个性化的,基于每个学生的教学战略。比如说学生的退学率,学生的考试成绩以及提出一些建议,老师应该在什么时候介入,如何在学生和机器之间进行介入。

2.我们要从哪些数据中学习?

长期以来,我们看到很多系统都会计算网络的数据,会计算学生是否答对了题目,以及在这道题上花的时间和鼠标点击的次数。我们发现不同类型的数据,包括环境式的数据,有这些环境数据我们可以更好的了解学习者的情况,比如说教室里是不是有噪音,温度是不是合适,我们也看到了很多身体上的传感器,比如说有智能手表和智能椅子,都可以感知学习者的学习状态。未来我们还会有智能椅子的发明,它可能会监测到学生是不是摇来摇去,有没有走神,我们也可以用EEG来监测大脑的状态,所以机器学习方面我们发现数据的来源也很重要。

还有算法,对于机器学习来说也很重要。我们可以看一下算法的情况,这种是监督式学习的体系。这是卡耐基梅隆大学一个博士生提出来的,有这样一个网络,可以预测哪些学生会退学,或者会从网课中退出来。它监测的一些数据就包括了学生在课程上花的时间,以及鼠标的点击数量,所以监督式的学习会从输入和输出端进行监测。中间是一个网络式的结构,监督式学习对于智适应教育也非常重要,我们就需要一系列的技术来提升监督式学习的精确度和效率,要考虑到学习当时的情景。

比如说我们想要把网络训练的更加智能,进行更好的监测,这个学生会从哪门网课中退出,或者会不会从其他的课程中退出,这也是在跨任务转移当中我们需要关注的点。

3.多任务处理学习。

这个学习理论是20世纪90年代末期提出来的,我们想要有很好的训练体系,有时候我们想提升准确度,我们会预测其他的一些变量。比如说我们要去监测哪个肺炎病人在疾病末期会变得非常严重,不光是肺炎的严重程度,还可以来评判一些其他的参数或者变量,比如说白细胞的数量或者是他们有没有到ICU进行治疗,我们就可以让系统来预测很多不同这样的变量,其中最重要的就是看一下肺炎的严重率。

在这方面我们也可以考虑一下,用这样的模式来预测学生的退学率。其中一个方式我们并不是让系统只看他的退学率,而是看其他的变量,比如说他期终考试的成绩,这样的技术之所以能成功,是因为它可以训练我们的系统,有对多个变量的预测,这样就能让学习者更好的来学习神经系统,而且在这个过程中可以有一些归纳的程序,让这个系统能够更好的预测我们真正感兴趣的变量。

在机器学习的算法中,另外一个非常有意思的方法就是非监督式学习,这也是我的同事在卡耐基梅隆大学做的研究。他们看了一下不同学生的聚类,主要是看一下他们回答问题的正确率,他们把所有的学生聚在一起,把不同的表现分类。大家可以看到有三种非常不同的结果,对于其中一组来讲,他们一开始做得特别好,但是后来突然间下降了,之后就做的没有那么好了。对于这种非监督式学习,我们发现一个规则之后就可以进行干预。比如说我们可以预测一下这三组人他们期末考试成绩是怎么样的,更好的指导其他的学生。

增强学习,这一定非常重要,是因为有特殊的学习算法。也就是在每一个时间点,在整个过程中我们都会给它不同的行动,我们可以在AlphaGo中学习,也可以使它不断增强能力,打败了围棋冠军。在增强学习这方面它也是基于决策过程,简单的说法就是比如说在围棋方面,每个围棋上的点,下每个子都是一个决策,我们会有一个奖励或者激励的机制,就是我们要通过这样的奖励机制告诉系统他们应该做什么,怎么样达到成功的结果,我们就有这种奖励机制,如果对手放弃的话你加一百分,你放弃的话就减一百分,我们不断的训练这个系统。这个过程中可能会产生数百万个行动的序列,不同的顺序,在AlphaGo方面一直是跟自己对弈进行训练的。

我们看一下这样的方式,其实是和我们智适应学习概念非常类似的,比如说在智适应学习中我们也有不同的状态和不同的行动,这个状态指的就是学生的学习状态、心理状态。现在的行为是指教学行为,我们应该给他考试、放视频还是评估呢?我们同时也可以定义一些奖励机制,告诉我们想要选择什么样的行动能更好的促进学生的学习。如果是正分就说明我们做得好,负分就说明做得不好。在每一个学习的状态下应该采取什么样的行动,在这样的反复训练中我们就可以有整个行动的序列,最终拿到最好的奖励。

关于增强学习非常有意思的一点,就是在这方面有很多进展,在过去5年中有非常大的进展。大家可以看到,在围棋中我们也有很多的变量,在这个过程中我们有很多变化的问题模型,也是一个非常个性化的模型。在机器学习的研究人员来看,我们也会有这样一些变量以及一些抽样的方法,包括对于算法,对于数据来进行选择,现在我们处在最好的时代,对于咨询教育来说。

我们再来看一下第二部分,看一些更加具体的研究,首先看一下新的收集学生问题的类型。每次我们想到机器学习的时候都会相应的算法,比如说是40%,另外60%的重要性来自于数据,我们想要做得好的话数据是非常重要的。我想告诉大家一个我的同事做的研究,这个人和计算机在进行互动。“你好吗”“我很好”,在谈话时他的表情和面部在不断的被追踪,“你想要看什么样的新闻?”“看一下棒球的新闻”,计算机有不同的监测。系统所做的是1秒1秒的来追踪这个人的面部表情,同时来追踪他的语音,这样可以推断这个人的情感状态,在这个过程中系统会显示红点在不断的移动,就是看一下这个人的情感状态,是积极的还是消极的状态,以及他的能量和整个情感状态。

这样的项目现在仍然在进行中。它是由卡耐基梅隆大学的教师做的,也是和另外一位教师合作,他们要将这样的技术应用来分析视频,这个视频也是师生互动。这个视频讲的是有些学生他们想要解决数学题,在这个过程中我们可以看到每一秒都可能有不同的情绪变化,学生的情绪会发生改变,系统会出现一些小的框代表谁来说话了,或者他们有没有看老师这样的动作。

这样的一个技术现在仍然在开发,大家可以看到它的基本概念,这个技术如果变得越来越好的话我们就会面对这样的情况,就是每一秒我们都会监测学生的情感状况。比如说我们在一个屋子里,有很多学生和一个老师,这个老师就会有每秒钟的反馈,看哪一个学生他现在就要给予指导。因为在他们的实证研究中发现,教师延时的反馈和负面影响是有正相关关系的。

这是刚才给大家举的一个例子,就是现在我们仍然在进行的一个研究,以后可能对整个教育界会产生非常大的影响。

另外一个研究的方向我觉得也是非常有意思,就是要探索新的教学互动方式,我会给大家看一下我们大学一位教授的研究。他说有的时候我们通过教别人反而学得更好,也就是说在这个过程中我们会让学生充当教师的角色,让他们来教这些模拟学生。大家可以看到这样的一个情况,是有一些真的学生在线上教这些模拟学生。在这个过程中我们可以看到,其中有三个不同的方面,有模拟学生,也就是基于计算机的方面来学习如何解数学题。他们这方面也是有一个机器学习的算法,也是可以通过不同范例的问题来学习解决这一类问题。

在屏幕上会有一步一步的解决方法,来征求人类教师的解答。我们的人类学生是来教这些机器人做这个题的,教这些机器的系统,他们会教模拟的学生如何来正确的做这道题,正确的回答。

还有第三个方面,基于计算机的人物Willams先生,知道如何解决任何题,可以及时记录并且指导,他是来帮助这些人类的同学,让他们在这个过程中如果有需要指导的话可以进行指导。这也是非常有意思的,我们可以看到是通过教学来学习的,它可以比传统的教学更加有效。比如说我们刚刚谈到的计算机里的专家Willams先生,可以先帮助学习比较差的同学,让他们获得成功。

我们也做了一些其他的研究,这些研究发现我们教河流生态系统的时候,用这种教的模式让学生去学,比传统教学模式效果好很多。这是非常有趣的想法,但是我们必须有人工智能的技术才能创造这种模拟的学生,这样的教学模式才可以实现,所以这种教学模式会有很大的可能性。

我自己的团队也做了一些尝试,我们想要建立一个体系,让学生去教计算机。我们用的是自然语言来进行理解,我们的想法刚开始跟教育没有什么关系,我们刚开始的想法就是想做一个东西,让手机的用户教手机一些东西,用自然语言进行教学。比如说我告诉我的手机,我生产在匹兹堡,如果下雪的话请提前30分钟告诉我,因为我需要知道天气的情况。在这个过程当中我想要让所有人都能够教他们的手机进行重新的编程,所以我就给大家举一个例子,我们是如何去做的。

给大家举一个非常简单的例子,我们是用当前的系统去做的。我们可以看到有一个视频,会听到我们的博士生跟机器说“四点钟的时候我们要开会”,机器就会说“我不知道四点钟开会是什么意思”,所以它会说“你想要教我的话你就教我”。他就会跟系统解释“下午四点开会”是什么意思,机器要做什么事情。

“首先你要创造一个新的邮件”“写一个新的邮件是吧”“是的”。已经有了新的邮件了,“把收件人全部改成我团队的成员”“收信人是你的团队成员,已经写了”“我们写主题是下午四点开会”“邮件主题是下午四点开会”“再点发送”“好的,我已经发送了”就是这样子,所以它要做一个测试。“我现在已经知道了,会去通知别人做事”“跟我的助手说一下下午四点我会很忙”“跟你的助手说一下你下午四点会很忙是吧”“是的”“现在就去执行”“好的”。

我们可以回想一下,对话刚开始是跟团队说一下下午四点钟开会,这个系统会说我不知道,然后你一步一步的教它,比如说要发写邮件,收件人是谁然后再发送,这就是一个训练的模型。

对话的第二部分是说告诉我的助理,要告诉这个系统自然语言是什么,要一步一步的教它,这个训练之后系统会说我明白了。你告诉我的助手下午四点我会很忙,所以第二个语句跟第一个语句是非常像的,这就是说你要告诉别人做一件事情,但是这个系统经过训练之后他们就会在第二次理解这样的语言了,这就是自然学习语言的方式目标和做法。

这里面有两个理念,第一个理念就是每句话的句式它都是可以执行的,对句式进行翻译并且变成可执行的代码。还有学习,比如说系统要学习新的步骤,系统也在不断的学习自然语言处理的能力,因为它可能不知道“告诉”是什么意思,现在它就知道了“告诉”是什么意思。像这样的一个研究是我们之前做的,刚开始只是一个小的想法,没有想到是教育,如果把这样的想法跟当前的教育行业结合起来的话,跟模拟学生、计算机学生结合起来的话,我们会发现学生跟计算机的体系会有很多互动,之间的潜力是很大的。

最后要跟大家做一个总结,在刚开始的时候,我们谈到了现在对于智适应教育来说是一个非常兴奋的时代,我主要的理论是人工智能是这个时代主要的驱动力,会改变我们数据的本质,会让我们收集到非常多的互动性的数据,人与电脑之间的互动性数据,我们还可以获得更多关注学生的高质量的数据,我们可以加入到对话式的学习。我觉得会有一个转变,之前我们会觉得教育是老师和学生之间的事情,但是我觉得它现在是一个三方的事情,包括老师、学生和电脑,以及这三者之间的互动。

现在在中国我们有非常好的独一无二的优势,能够在AI教育方面成为世界的领先者。中国的教育部也有非常有趣的一些项目,中国有最大的学生数量,所以我们发现今天有很多人来参与教育AI人工智能的会,这也表明了大家对此非常重视,中国也很有可能会成为世界上首个国家能够向大家展示如何用学生当中获得的数据来改善AI的教育,以及教育和AI的结合,中国也能向其他国家展示如何运用方面的知识。

最后要感谢大家的聆听,谢谢。

*本文为整编,转载请留言。欢迎大家关注创业黑马集团教育产业号“火柴盒”(id:huochaihejiaoyu),触摸教育产业未来。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181203A1FONX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券