1000万个“AI名师”:用机器算法“解剖”应试教育 | AI聚变

栏目简介:自动驾驶、教育、金融、医疗…如你所知,AI 如毛细血管一般正渗透到各行各业,人们为“AI+”可能带来的爆炸性能量而奔走呼号,但也更愿意看到脚踏实地的技术实现和商业落地。为此,《AI聚变》将深入报道各行业公司的 AI 落地情况,以及未来发展的种种可能性。

AI科技大本营按:“AI 创造的是 100 万个、1000 万个名师”,“AI 替代了名师 70% 的必杀技”——就是这样两句话,在整个采访过程中,论答创始人王枫分别重复提及了 5 次。某种程度上,对于那些为在线教育提供人工智能解决方案的公司来说,这或许说出了创业者们利用新工具开拓大陆的心声。

说出这些话的王枫是有底气的,更实际的则是探究其背后的具体根源。如他所言,是骡子是马,拉出来遛遛。

以下为王枫口述,AI科技大本营整理:

我做了二十多年在线教育,现在做的是以前梦寐以求想做却做不到的系统。2002 年我在佐治亚大学读教育技术学博士,做学习系统的研究与开发时,没想到会有 AI 这么靠谱的技术。

AI 在教育里一个很成熟的应用是“自适应学习(Adaptive Learning)”,其实在九十年代就开发了出来,当时在卡内基梅隆开发的叫“认知向导”,纽约大学的叫“ALEKS”,但那时计算机运算能力没这么强大,算法不一样。

一直到 2008 年,美国 Knewton 公司成立,前后融了 1.55 亿美金,把自适应学习做到了大规模商业化应用,2011 年可汗学院做出了美国最早的学习管理系统。

虽然技术以前是在美国发展,但其实生不逢地, 因为 AI 最适合的是有明确学习目的、可量化的应试教育,所以不仅仅是技术和算法,它必须要和内容、应用场景结合起来。

Knewton 以前走过的最大弯路是算法、系统、内容都做,后来发现系统、内容都不挣钱就只做算法 API 引擎,让任何内容都可以 adaptive。听起来理念是好的,事实上根本没法做到,而且即使做了也都是表面的自适应,没有真正深入到让学习内容、学习过程通过算法、系统来产生价值。

在线教育在中国兴起是在 2013 年,大家开始知道了 Knewton、自适应学习,大量资本和互联网人才开始进来了。

2016 年 1 月 8 日,我记得很清楚,我们团队开发出了 Knewton 级别的算法,我还在产品上做了中考英语必考的专题,当时感觉系统后面好像有一个老师围着你读题、出题,很震撼。虽然那还是比较小的知识图谱,但只要几道题系统就可以把 20 几个知识点全部摸清楚。

论答的每个知识图谱平均 3-5 个月时间才能做出来,它是由老师团队和数据科学家团队共同合作来完成。因为人类老师思维的图谱是机器无法理解的,需要他们一起把它拆解为算法可以理解的语言,然后进行匹配,如果后面有大量数据进来,知识图谱还会进行学习和调整。

我们现在已经做了成百上千个知识点的大图谱,这之间的差别在于每增加一个知识点,系统的运算量都是呈指数增长。比如每个知识点有两种可能性——掌握和没有掌握,19 个知识点掌握的可能性就是 2 的 19 次方,等于 524288 种,181 个知识点就是 2 的 181 次方,跟宇宙的原子总和差不太多。这必须通过算法进行优化。

我们的智能测评系统里有 1700 多个测评专题,你能想象到的所有知识点已经基本覆盖了,这一步的目的是找到孩子的学习问题。以中考代数为例,在传统的纸质试卷中,一个知识点 3 道题,74 个知识点需要 222 个题,每个题 3 分钟需要 666 分钟(11 小时),才能达到 90% 以上的精准度。课外培训 5-6 次,一周 2 个小时,就需要一个半月的时间。但现在已经平均只需要 8 道题,每道题 3 分钟,不到半小时就可以摸清中考代数 74 个知识点,精准度在 92% 以上。

第二步是推荐下一步学习什么,背后用的是“学习路径推荐算法”,应用到了智能学习这款产品中。比如 A 学生可能推荐一元一次,B 学生可能推荐因式分解,C 学生可能推荐小学的乘法快速运算。外面很多所谓的自适应学习其实是基于简单的规则,比如一元二次方程你做错了,预先就会给你推五个一元一次方程,再推五个一次分解的题目,跟算法引擎相比差别很大。

第三步,在最短时间内攻克知识点。一个好老师知道你现在就该学一元一次方程,帮你在最短时间内边做边学边练搞定这个知识点。我们的算法是做 3-5 个题就能准确判断一个学生是否能攻克,然后推荐下一个合适这名学生学习的知识点。

可以说,名师 70% 以上的必杀技都被我们的系统替代掉了。去年,我们招了一些教学老师和一两百个学生,来把智能测评、智能学习这些产品都用起来。现在一个没有任何教学经验兼职大学生老师,平均只需 3-6 小时的在线培训,配合我们的系统就可以达到优秀老师的教学水平。

所以 AI 能创造的是 100 万、1000 万个名师,在最短的时间内就能找到每个孩子的学习问题,然后有针对性的进行教学,把孩子的分数提上去。

教育行业对 AI 底层技术要求非常深,我们三年来踩过不少坑,那不是简单靠砸钱就能够搞定的。

教育的深度技术类产品很难真正完全标准化,每个学科,还有版本、地区都不一样。目前我们只有 6-9 年级的英语和数学试题,为什么不开发更多学科?因为背后是巨大的系统工程,找老师、教材、内容是很轻松的事情,但做每个学科的内容需要从知识图谱、算法、内容、大量数据进行不断的调适。

每个学科也没有一成不变的算法,英语和数学不一样,英语的听力、语法、阅读都不一样。后台百亿级以上的运算,在英语里面只有语法才有真正的知识图谱,听力和阅读没有知识图谱。

计算机行业有一句话叫“进去的是垃圾,出来的也肯定是垃圾”,算法、知识图谱再精准,匹配的题目如果对不上号,测出来也是不准的,最后还得根据数据来鉴别哪些内容是高质量的,难度区分度是怎样的。

本质上说,算法引擎、系统、内容垂直整合才是完整的人工智能学习系统,缺一不可。论答的系统是个有机体,已经不是靠简单的算法能够解决的,而且越往内核走就越难,这是核心竞争力。

论答不是培训机构,这里面的水挺深,我们的基因更适合做技术,输出综合性解决方案,也不是简单的卖技术。我们现在除了技术要不断开发外,我们要做的是开发模式的复制,其次我们不但要自己把它做起来,而且还要家长认可这种模式,这个过程不会太容易。

应试教育在中国有 1 万亿元的市场,但像学而思、新东方这些上市公司加起来不到中国教育市场份额的 3%,为什么他们都吃不下来?

因为根本没有那么多好老师,更大的悖论是,中国有 40 多万家培训机构,好老师都自己出去办培训班了。这也说明这个行业是依赖老师的重服务模式,虽然有了 AI 之后行业要整合,但小机构不用那么猴急觉得明天就被吃了。

像我们这样的 AI 公司初期研发成本投入很高,但未来的应用成本一定非常低。如果只是几百个学生用我们的系统,一个学生的研发成本就几十万,但如果是未来 1 万家培训机构,一年 1 个亿,一家机构的成本才 1 万元。对用户来说,以前名师一堂课需要 1000 元/小时,我们的系统可能只需 50 元/小时。

所以下一家百亿美金以上的教育公司是由 AI 技术驱动的。2002 年到 2015 年的在线教育只是改变了教育在交易和传播上的模式,没有带来质的变化,但 AI 开始从根本上改变着教育的生产力。从培训行业开始,接下来中国教育的模式在 3-5 年内以机器为主的学习会成为主流,低价值、重复性的劳动一定会被机器替代。

不过,AI 的价值潜力现在释放了还不到 1%,是 0.01-0.1 的过程,但这已经无比巨大,一点都不夸张。我觉得我们现在是一个小型核电站,电只能供应周围这一片,等到真正开始发现核爆炸、核聚变的时候,就完全不一样了。

10 年前,刘强东说京东要花几十亿美元做仓储,没人相信,但现在看来是理所当然的。今天去想象 3、5 年后 AI 老师的价值可能觉得不可思议,但到时当它成了主流模式之一,你也会觉得是理所当然的。

题图:marketingland

——【完】——

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-07-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

谷歌AI研究大爆发:一年发218篇机器学习论文,近年研究人员增两倍

李杉 编译自 Technology Review 量子位 出品 | 公众号:QbitAI 《自然》、《美国国家科学院院刊》、《美国医学会期刊》,这些都是当今世界...

3396
来自专栏新智元

CMU教授炮轰谷歌:一切都是商业计划,机器学习原理停留在20年前!

【新智元导读】Twitter今天出现了一条惊爆tread:CMU助理教授Simon DeDeo炮轰谷歌大脑,认为他们没在做真正的科学,只是用强大的算力以及招揽到...

910
来自专栏AI科技评论

观点 | LeCun、Jordan、李开复圆桌全文:AI的现状与未来

创新工场董事长兼 CEO 李开复、Yann LeCun、Michael Jordan、高欣欣针对AI的现状与未来做了圆桌讨论

1176
来自专栏大数据文摘

互联网金融中的AI:一个使命,两个循环,六个机会

1852
来自专栏人工智能头条

搜狗汪仔《一站到底》完胜人类 背后核心技术曝光

3204
来自专栏华章科技

35所高校要开设大数据专业!你怎么看?

各大高校紧锣密鼓启动大数据人才培养,缘于大数据时代催生的大量相关人才缺口。其实就是一个问题,市场的需求在驱动。

964
来自专栏AI科技大本营的专栏

2017年首份中美数据科学对比报告,Python受欢迎度排名第一,美国数据工作者年薪中位数高达11万美金

最新消息,Kaggle最近对机器学习及数据科学领域进行了全行业深度调查,调查共收到超过 16,000 份回复,受访内容包括最受欢迎的编程语言是什么,不同国家数据...

3787
来自专栏DT数据侠

混沌的边缘,是一切开始的地方 | 数据科学50人·吴海山

如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家...

1150
来自专栏企鹅号快讯

人工智能已成趋势,C+又将重新焕发光芒

人工智慧从字面上看就是人造的智慧,但是实际上涵盖了不少部分,大家最关心的实际上是人工自主意识,因为网络和电脑已经完成了知识的检索和存储,几大搜索引擎也完成了关键...

2170
来自专栏企鹅号快讯

斯坦福教授发布首份 AI Index 报告,指引 AI 工作者不再“flying blind”

AI 科技评论按:前两天斯坦福大学计算机科学院教授,前谷歌首席科学家 Yoav Shoham 来到中国做了场《人工智能的过去、现在和未来》的报告,报告中他除了介...

2106

扫码关注云+社区

领取腾讯云代金券