MMP现在学生做作业还能这样抄答案!?谈教育行业的数据应用

说说我最近了解的在线教育行业的大数据应用。

教育行业主要有2块数据:

1、题库数据:比如初高中阶段,大概有3000多个考点,而每个考点下面又有几百上千道例题,这样就构成了一个上亿条的例题数据库;

2、学情数据:简单地说,就是学生在每一个考点下面形成的个性化的强弱程度的评分,比如全国初高中学生大概有1亿人,这1亿人在3000多个考点下面又各自有自己的强弱评分,这样就构成了一个几千亿条的学情数据库。

如果构建了这2块数据并进行打通,对学生的成绩提高,及对学校教学资源分配效率的提高是巨大的。

过去,这2块数据是这样构建的:

1、题库数据:简单地说,就是各种辅导书、参考书、上课笔记等,这些纸质的书散落在各个地方,查看不方便,各种书之间的知识点也不能互相打通,同时你也无法把市面上所有书都买下来,题库数量有限;

2、学情数据:简单地说,就是考试,学生通过每个阶段的考试,获取自己的学情反馈,但考试获取的是一个总体的分数,无法精细到每个知识点反馈你的学习情况,同时考试的时间成本太高,没法天天进行,因此无法实时反馈你的学习情况,再者纸质的试卷难以保存,容易丢失更难以结构化地构建个性化的学情数据。

从以上可以看到,传统的数据构建方法,有非常大的提升空间。

因此最近2年在线教育的大数据应用,主要在于:

1、如何更高效地构建题库数据;

2、如何让用户更高效地获取题库数据和学情数据。

由此而萌生的创业公司,规模较大的有小猿搜题、作业帮、学霸君3家。

在第1点,如何更高效构建题库数据方面,3家都是通过

1、向出版社及民营教辅出版机构购买试卷和答案

2、用户上传

通过以上方式不断积累题目的同时,又通过人工或者智能匹配的方式,给题目挂上各种知识点、难易度、中高考真题、类型题、时间、区域等标签,形成一个庞大的,每道题都有各自多维标签的题库。

而在第2点,如何让用户更高效地获取题库数据和学情数据方面,3家主要通过让学生对着教辅书的题目拍照这个操作,让学生在几秒内,就能获取到该题目的答案、知识点,甚至是跟该题目相似的关联题目,而这就涉及到机器学习方面的技术,因为在识别学生上传的照片的过程中,需要对字符、公式等进行定位、切分,然后再对应地在题库里进行关联匹配。

打着拍照即得答案这个卖点,3家公司迅速圈得一批用户。

用户有了,接下来是如何盈利,这些公司主要有以下2个盈利方式

1.发展线上教育,卖课程

2. 卖打包的题库

势如破竹的发展,和清晰的盈利模式,也让这些公司能够轻易地开展融资:

2017年1月,学霸君宣布获得1亿美元C轮融资; 2017年5月,小猿搜题宣布获得1.2亿美元E轮融资; 2017年8月,作业帮宣布获得1.5亿美元C轮融资。

这种规模,跟2017年1月获得D轮1亿美元融资的知乎是相当的。

靠着开放二胎的风口,未来的互联网教育公司会越来越多,相信大数据在这个行业会有越来越多的应用场景。

=THE END=

原文发布于微信公众号 - 挖数(washu66)

原文发表时间:2018-01-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏xingoo, 一个梦想做发明家的程序员

《影响力》—— 读后总结

14950
来自专栏新智元

【快报】AlphaGo后台数据首次公开 | 北京5条地铁将用自动驾驶

新智元 AI DAILY 1 AlphaGo后台数据首次公开 免费网站8月中旬将面世 ? 7月25日上午11:00pm,谷歌旗下DeepMind团队在欧洲围...

36260
来自专栏大数据文摘

从洞穴壁画说起,信息可视化图表发展的迷人历史

17670
来自专栏程序人生

谈谈如何做研究

今天谈谈我自己做研究的方法 —— 它跟随我多年,且一直在演进和完善中。我虽然没有读过 PhD(希望有生之年能够尝试一下),但我自认为这法子并不算差 —— 至少,...

362110
来自专栏PPV课数据科学社区

利用人性弱点的互联网产品(一)贪婪

毋容置疑,“贪婪是推动销售的中坚力量”。其实贪婪有个比较俗的名叫做贪便宜。三年前是团购、点购、秒杀、抽奖最疯狂的时候。而现在百团大战、千团大战都...

37860
来自专栏腾讯社交用户体验设计

茶·花·小黄脸——QQ新增表情

15720
来自专栏机器人网

揭秘高考机器人AI-Maths是如何答题的?

11个黑色方盒子被装在一台一人多高的机柜里,身后连着密密麻麻的电线、网线,设备嗡嗡作响,信号灯不停闪烁,旁边两台空调正在抓紧工作。如果室温超过25摄氏度,这11...

28860
来自专栏CSDN技术头条

盘点|开发者必读的十大经典书籍

编者按:人生如逆水行舟,不进则退。开发者想要保持自身的竞争力,做到所向披靡,知识储备必不可缺。这就意味着,简单的代码阅读远远不够。 快速迭代的信息社会,技术前...

20370
来自专栏机器人网

机器人的第一场车祸该如何避免?

日前,一则机器人出逃的消息火爆了科技圈,据说是因为工程师忘了关门,Promobot机器人就从实验室偷偷溜了出来,结果却因为电量不够而被迫停在了马路中央,造成了不...

30370
来自专栏程序人生

谈谈工作 - 神州数码篇

我的工作历程不算太长,但也不短,11年工龄,30岁出头,要写这么篇文章,其实很尴尬。刨去创业两年时光,我也就是9年在企业里工作的经验,更尴尬的是,这9年时间我就...

82950

扫码关注云+社区

领取腾讯云代金券