专栏首页IT大咖说机器学习在开心词场(自适应学习)中应用

机器学习在开心词场(自适应学习)中应用

摘要

教育是最传统和复杂的社会活动,如何使用AI(机器学习)技术改造和促进人类自身学习(提高学习效率和学习效果) ,是互联网教育大数据及挖掘的基本问题;简单介绍AI 技术应用沪江各个产品线(核心包括辅助学生“个性化”学习和辅助教师教学工作)的情况,重点分享:使用DM、ML技术结合RM(Retention Model)、IRT(Item Response Theory)、DKT(Deep Knowledge Tracing)等模型在开心词场中应用实践和认识。

视频内容

关于教育及互联网教育

教育是最传统、最复杂、涉及面广的社会活动,而学习是痛苦的,人类都是不爱学习但是渴望成长。

互联网教育的特点是低频、高交互。我们的使命就是使用机器学习技术改造和促进人类自身学习,让学习更快乐,提高学习效率和学习效果。

机器学习在沪江网的应用

机器学习在沪江网应用主要四个维度出发:老师(网师)、学生者、内容、工具,进行构建四大应用场景:

自适应学习、人机交互、教学过程监控、内容加工。

网师

机器学习可以在大数据基础上帮助网师全方位洞察学生者、洞察自己,以及洞察整个市场。

洞察学生是要知道所有学习该课程的学生的学习情况如何,了解每个细节知识点的掌握程度。

洞察自己是发现网师在讲课过程中哪些知识点、流程或节点会使大家在理解上有问题,并辅助网师对课件进行修改。

洞察市场是概括地从整个大方向来说,哪些课程会比较热门。

随着人工智能在教育及互联网教育上逐步应用和发展,老师(网师)角色也在改变,逐步从“知识传递”的角色转移“能力培养”和“品德培养”。

学习者

自适应学习分为智能导学服务和智能学习助手。智能导学是把一门课拆分成不同的知识块,给每个人提供不同的合理学习路径。智能学习助手就是重新定义老师和机器的定位,将老师的一些重复性工作交给机器来完成。

我们在丰富的大数据基础上,充分利用数据分析、挖掘和机器学习技术,根据学习者详尽学习轨迹数据从学习需求、学习意愿、学习能力、经济能力、学习毅力等维度构建用户模型。

在学习过程(学习系统)中做一些高交互的改进,优化课件的内容和设计,在题库等内容库上推荐题目和学习资料,在考试过程中提供合理的评测周期,带来丰富多样的学习体验。

内容

教育场景中存在老师、学生、教学辅助人员等多种⻆色。⻆色互动时会产生大量数据,包括并不限于文本、图片、音频、视频、用户行为等内容形态。传统教学中,除了少部分能被老师感知的部分,大量数据都没有得到利用。

充分地对数据进行收集,并构建一种面向教育行业的标签体系;一方面,将这些数据沉淀为结构化的知识,让他们具备教学价值;另一方面,在不同的应⽤场景,这些数据也能对商业化提供帮助。

标签及度量体系:教育场景存在大量维度,通过数据挖掘和机器学习,对内容进行打标,输出对应标签及相关性、相关度量指数。

构建各学科、各层次知识图谱,题库及资料库。所有课件、知识点的内容都会关联到知识图谱上。在知识图谱上我们可以做很多工作,比如一个知识点掌握得不好,可以通过知识图谱进行分析关联。

为加速内容的产品化和助推内容商品化提供一些开源的数据、算法支撑。

工具

机器学习在工具线应用主要包括以下三方面:

通过开放接口与教学场景深度融合;

开放用户行为感知和数据分析;

应用智能云服务。

通过数据和机器学习技术构建学、练、测等全流程的智能化、个性化的工具。

机器学习在开心词场中应用

开心词场是沪江旗下的背词练习工具,通过学习、测试、复习的游戏闯关模式,掌握词汇,更添学习乐趣。机器学习在开心词场中应用主要介绍两个模块:基于IRT模型的自适应词汇量测试和基于记忆模型的个性化闯关路径。

基于IRT模型的自适应词汇量测试:基于IRT模型最少用户交互准确评估用户的词汇量,在自适应词汇量测试的基础上,推荐一些合理的词书。

基于记忆模型的个性化闯关路径:在背单词的过程中,根据每个人的记忆特点计算记忆曲线,利用这个记忆曲线来安排合理的关卡。

基于IRT模型的自适应词汇量测试

静态考卷:每个人所做的题目相同,学生在肯定会做的容易题和肯定不会做的难题上浪费较多时间,影响用户体验。

动态交互式测试:每个学生所做的题目不同,下一道题目根据历史做题的反馈动态改变。算法可以聚焦于算法不确定的题目,请学生回答,从而避免在肯定会做和肯定不会做的题目上浪费太多时间。

IRT (Item Response Theory)

人能力越高,答对概率越大;

词难度越高,答对概率越小,曲线越靠右;

人能力=词难度, 则答对概率0.5。

如何选下一个词?

选难度和当前能力估计最接近的,且用户没有回答过的词。对于该词,P(答对|词难度,人能力)~0.5,即最不确定,从而避免两种可能浪费时间的词。

可以改进的方向

如果存在多个学习路径,可以使用混合IRT。

使用深度神经网络,可以很好的解释现有的数据。

推题策略的改进就是使用MDP。

基于记忆模型的个性化闯关路径

基于记忆模型的个性化闯关路径:在背单词的过程中,根据每个人的记忆特点计算记忆曲线,利用这个记忆曲线来安排合理的关卡。基于记忆模型的个性化闯关路径的算法模型经历三个主要阶段:艾宾浩斯记忆曲线、间隔效应、Act-R;接下来正实施MCM模型。第一段(艾宾浩斯记忆曲线):主要构建群体艾宾浩斯记忆曲线及每个学习者的个性化记忆曲线;第二阶段考虑间隔效应进行构建曲线模型;第三阶段基于Act-R算法建模。

艾宾浩斯记忆曲线→间隔效应→Act-R→MCM

概率随着时间指数衰减:

其中m,h,f是常数,分别解释为初始学习的程度(0<m<1),时间的缩放因子(h>0),以及记忆的衰减指数(f>0)

艾宾浩斯记忆曲线:y=1-0.56x^0.06

多次学习对记忆的影响:间隔效应(Spacing effect)两次学习的间隔记作ISI(intersession interval),第二次学习和最后的测验的时间记作RI(retention interval)。

Act-R

ACT-R假设每次学习会有不同的记忆概率轨迹,而且记忆概率随着时间的增长成幂函数衰减:tk,dk指的是第k条轨迹的记忆时间和衰减指数,β是和学生或者记忆事物有关的影响记忆强度的参数。bk指的是每条记忆轨迹的显著性,这个数越大表示一次学习的效果越好。

轨迹的衰减和学习发生的时间点有关:这里c和α是常数,如果第k次学习和前一次的间隔比较短,会导致当前的一条衰减的比较快。

回忆的概率和记忆活性m单调相关:其中和是相应的参数。整个模型有6个自由的参数。

MCM提出了一个假设,每次新的学习学到的东西是分别存储在不同的轨迹中,而且会按照不同的速率衰减。虽然每条迹会指数衰减,这些轨迹的和随着时间的衰减是一个幂函数,丼例来说,第i条轨迹,xi的衰减如下面公式所示:

其中是衰减时间常数,而且后续的轨迹具有比较小的衰减时间常数,轨迹1-k使用了一个加权平均,最后合成了一个总的轨迹强度。

其中

。yi是一个权重因子,代表了第i条轨迹的贡献,在总共k条轨迹中,记忆的概率是其中的最小值:

间隔效应发生的主要原因是轨迹的更新规则(Staddon et al.,2002)。一条轨迹只有在其它轨迹无法保持对材料的记忆的时候才会更新。这个规则影响了信息在不同发生频率和不同环境下的记忆效果。当一个材料被学习的时候,第i条轨迹贡献的上升和前面轨迹的总强度负相关:

我今天的分享就到这里,谢谢大家!

本文分享自微信公众号 - IT大咖说(itdakashuo),作者:王新义

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 全云时代,企业上云最优选的解决方案

    全云时代的到来,在企业创新以及传统应用陆续上云的成熟阶段,核心业务和涉密业务都需要考虑如何在云时代进行角色切换。针对企业核心业务上云,华为云Oracle上云解决...

    IT大咖说
  • 干货 | 携程高级数据分析师李翔:机器学习在携程酒店图像数据中的应用

    嘉宾演讲视频 Guest Video ? 温馨提示 本视频时长33分59秒,建议在wifi下观看 机器学习是一门让计算机在非精确编程下进行活动的科学,计算机科学...

    IT大咖说
  • 华为敏捷/DevOps实践:如何开好站立会议

    内容来源:华为云 DevCloud 首席布道师 & 资深产品经理刘恒的技术干货分享。IT 大咖说(微信id:itdakashuo)经华为云和讲者授权发布,转载请...

    IT大咖说
  • 强化学习-Reinforcement learning | RL

    强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的...

    easyAI
  • 机器学习入门介绍

    机器学习的方法改变了计算机的工作方式,它使得计算机不再依赖于硬编程,而是可以从实例和经验中进行学习。你把数据喂给它,它根据特定的算法和数据建立逻辑,输出结果,期...

    滚神大人
  • 机器学习入门系列(1)--机器学习概览(上)

    最近打算系统学习和整理机器学习方面的知识,会将之前看的 Andrew Ng 在 course 课程笔记以及最近看的书籍《hands-on-ml-with-skl...

    材ccc
  • 白话AI

    过去我们用通过编写设定程序来直接让计算机完成某些特定任务,现在,我们还可以训练计算机,就像我们训练宠物一样。这就是用大白话来解释机器学习。当然了,对于一些相对简...

    后端技术探索
  • 49. 访问PostgreSQL数据库增删改查 | 厚土Go学习笔记

    PostgreSQL是常见的免费的大型关系型数据库,具有丰富的数据类型,也是软件项目常用的数据库之一。 因其可靠的稳定性,通常我们可以拿它来做Oracle的替代...

    李海彬
  • Go实战--golang中使用RethinkDB(gorethink/gorethink.v3)

    生命不止,继续go go go !!! 关于golang中操作数据库,曾经介绍了不少: Go实战–go语言操作sqlite数据库(The way to go) ...

    程序员的酒和故事
  • 机器学习 – machine learning | ML

    1956 年提出 AI 概念,短短3年后(1959) Arthur Samuel 就提出了机器学习的概念:

    easyAI

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动