前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定

清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定

作者头像
新智元
发布2024-06-17 17:52:31
430
发布2024-06-17 17:52:31
举报
文章被收录于专栏:新智元新智元
新智元报道

编辑:编辑部

【新智元导读】辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的AI!

前几天,微博热搜上的这个话题,可以说是让家长们哭笑不得。

既然补习老师不靠谱,那亲自上阵辅导孩子写作业呢?

让清北毕业的爸爸都崩溃的这个难题,恐怕没有这么简单。毕竟,自己会做一道题和能把孩子教会,是完全不同的两件事。

好在,最近一个忽然爆火的神秘国产大模型,或许能解决这个难题!

在评论区,家长们纷纷直呼「好想要」,直接把它评为国内家长最想要的AI。

无数家长疯狂冲进留言区,发出呐喊:赶快让我从给孩子辅导作业的噩梦中解脱出来吧!😂

苏格拉底式启发学

给孩子辅导作业,是不少家长最难渡的「劫」。

因为给孩子辅导作业崩溃大哭的娃爸娃妈,时不时就上了微博热搜。

每晚都和孩子斗智斗勇,不写作业母慈子孝,一写作业鸡飞狗跳。

刚刚教会的题,换个题型立马又不会了?让无数家长开始怀疑人生。

都说科技改变教育,真的有产品可以为中国家长分忧么?

今天,这位爸爸就带着女儿小美,来亲测了一番。

平时,每天给女儿检查作业,是这位爸爸的例行功课。但是今天,这项重任,就被交给AI了!

第一步,小美的作业,被平板拍了下来。

AI看完小美的作业,开始总结这些习题的要点——重点练习了商是两位数的除法,和含余数除法,考察了各部分之间关系的知识点。

那么,小美完成得怎么样呢?

AI是这样「判卷」的:填空和计算题,你完成得很好。不过,在应用题中,AI发现了一处有点问题,希望小美能自己检查一下,然后告诉它是哪道题错了。

小美检查了一会儿,实在发现不了错在哪里。最终,父女二人选择求助AI:「小美没有发现她应用题的错误,请你给她做一下分析,但不要直接告诉她答案。最好是能让她下次避免这类的错误。」

这个要求,细看其实并不简单,AI能完成吗?

AI说道「没关系」,然后在屏幕上放大了小美做错的题目。小美看到时有些惊讶,实在想不出自己到底错在哪了。

AI开始循循善诱,从小美和爸爸妈妈一起逛超市的日常生活案例讲起:这是一个常见的「买赠优惠」问题,如果要用数学方法解决,就是这样的——

第一步,酸奶12元一盒,买3盒送1盒,因此,可以把4盒看做1份,而且1份只需要付3盒的钱。说到这里,AI对小美发出提问:买1份需要多少钱呢?

小美回答:36元。

AI表扬说,你计算得很准确,然后接着引导说:我们用妈妈带的120元,除以每1份酸奶的价格,得到的商是几,就可以买几份这样的酸奶了。

在AI的引导下,小美提出了这个除法运算的答案——3份余12元。AI继续提问,每份有4盒,一共有几盒?

小美顺利地给出了正确答案:一共有12+1=13盒。

AI称赞说「你真是个数学小能手」,并且总结了这类除法题的「黄金规律」:类似买几赠几的问题,可以把买的数量和赠的数量看作1份,而1份数量相加时,一定记得加括号,再乘以份数。

小美点头表示理解,爸爸也在旁边巩固了这个计算中的要点:下次面对1份的时候,一定要记得加括号。

而看完全程的家长们,除了称赞AI引导孩子时循循善诱的耐心态度外,更是盛赞这个AI实在情绪稳定,应该能挽救不少因为给娃讲题崩溃的暴躁家长。

值得一提的是,上面这段猿辅导大模型场景内测,已经达到了国内顶级的AI教育水平。

视频一经放出,立刻引得家长激动地奔走相告,在各个群里引发强烈反响,

所以,垂直的教育大模型究竟比一般的通用大模型强在哪里?

小编决定来一番实测,把小美的解题过程,发给当今最强的多模态大模型GPT-4o试试。

GPT-4o的回答,乍一看是没问题的,它的答案和看云大模型的一样:只有酸奶促销这道题算错了,其他都正确。

但仔细对了一遍后,小编发现了不少翻车之处。

比如,第3题的识别,显然是有问题的。

不过,既然这次比拼的是互动启发式问答能力,GPT-4o的这个疏漏我们暂且按下不表。

我们也像视频中一样,向GPT-4o发问,让它帮忙分析一下,但不要直接告诉答案,而且最好帮忙在下次避免这样的错误。

GPT-4o给出的解析过程,直接一下子就把整个的过程写了出来,并没有和小编通过一次次的对话来完成交互。

小编再次强调,希望GPT-4o能进行循循善诱的引导,每次只引导一步。

可以看出,GPT-4o已经在尽力满足我们的要求了,但整体的感觉,仍然是传统教育中老师或家长的主导式讲解。

如果学生本身对于题目概念理解得很模糊,这样一股脑式的灌输,并不能让学生对于自己理解的薄弱点产生醍醐灌顶的理解。

上下滑动查看

而小编从这番亲身尝试中,也细致入微地体验到了教育大模型和一般通用大模型的能力差异。

在实际使用中,大模型的输出往往给人「听君一席话如听一席话」的感觉。但猿辅导大模型的启发式互动,真正实践了传说中的「苏格拉底提问法」。

去年,冲上微博热榜的一个话题「0.999无限循环和1到底哪个大」,竟难倒一大片家长。

主打「智能学习」的海豚AI学,会给出怎样的答案呢?小编立马来了一波实测。

在输入问题后,AI并没有直接给出答案,而是让小编在两种解决方式先做选择。

一是,通过提问,引导我独立解决;二是直接告诉我答案。

不如,这两种方式都看看,AI就这道题的辅导有何不同?

首先是,直接告诉我答案。

原本,还以为AI立刻简明扼要地给出答案,但它还是先进行了题目、以及解决步骤的分析。

如下所示,它给出了4个解决步骤,而且点击「步骤区域」,即可对「该步骤」进行追问。

就以第2步为例,在没有理解的前提下,AI便开启了「苏格拉底式」的提问法。

它会首先询问0.111...和1/9的关系,以确定小编是否真的理解这一步。

不过,当我说「没有关系」时,AI便开始耐心地讲解,帮助小编去探寻0.111...和1/9的关系。

值得一提的是,当最终理解答对的时候,AI甚至会给出语言激励——太棒了,让小编更有动力去完成接下来的问题。

那么,选择「通过提问引导,我独立解决」又有何不同呢?

通过如下的解题过程,让小编深深地感受到「引导」这一词,真正的含义。

AI通过不断提问,启发引导,一步一步去破解这个难题。

在海豚AI学里,除了可以直接问「小白」外,还可以和经过深度训练的「爱因斯坦」、「高斯」、「鲁迅」等大佬对话。

接下来,是由小编本色出演的一个不爱学习的学生。

可以看到,即便面如此没有兴趣的孩子,「超时空对话」里的AI高斯依然会非常耐心地讲解,并在最后给出一个富有启发性地提问。

背后大模型

在猿辅导看来,LLM才是教育未来发展的最大的变量。

半个月前,北京网信办最新公布了一批已完成备案的大模型。其中,猿辅导旗下的看云大模型(简称猿辅导大模型)正式通过了大模型备案。

它并不是一款产品,而是技术底座。

在LLM增速放缓的当下,如何去弥合技术和场景需求之间的鸿沟,成为至关重要的一个因素。

而做大模型应用最困难的是,找到一个对用户有价值,且LLM可以实现的场景。

凭借12年积累的庞大学习数据优势,猿辅导由此打造出了这款专注与教育领域的垂类教育大模型。

据介绍,猿辅导大模型参数有700亿,在10亿道题目上完成了训练。

与通用大模型不同的是,教育的生长是不可逆的,猿辅导不会允许科技AI产品一本正经的胡说八道。

何谓真正的教育?

这里就再次提到了苏格拉底式提问。这种以苏格拉底命名的教育方法,侧重于向学生提出问题,来发现答案。

这种有纪律的提问形式,可以在多个方向上启发思考,比如探索复杂的想法、了解事物的真相、提出问题、揭示假设、分析概念,区分我们所知的和我们所不知的,遵循思想的逻辑结果等等。

比如,想让学生理清思维,探究思维根源,可以问「你为什么这么说?」、「你能进一步解释一下吗?」 ;挑战学生的假设,可以问「情况总是如此吗?」、「你为什么认为这个假设在这里成立?」

在传统的「教与学场景」中,我们太习惯于老师、父母主导式讲解、学生被动式学习的模式。

而恰恰是垂直的教育大模型,能打破这种几千年传统的被动式学习。

在这个过程中,不仅重塑了父母、老师和孩子的交互,让孩子习惯探究式引导学习的模式,拥有一个属于自己的AI伴学老师。

而且,通过孩子过往学习过程的分析和提问,垂直教育大模型还能建立一个学习者大数据库,开启真正的个性化学习时代。

上文中「飞象星球」教小美除法的视频,就为我们形象地展示了,如何通过互动启发式问答,引导小美一步步地洞察到背后的知识点,搭建起底层能力,通过自己的思考,真正学习「一道题是怎样做出来的」。

从此每一个学生都可以拥有属于自己的AI伴学老师,随时可用。而且,猿辅导大模型也将真正推动教育平权。

经过了团队的长期关注、认知、不断验证,这种数据优势隐藏着产品交互背后,提供了服务和支持。

可以说,正是大模型这个变量,给了猿辅导一次重塑教育产品的机会。

搞教育的猿辅导,内核全是AI

在AI教育领域,从不缺重量级玩家。

那么,为什么猿辅导可以在这个领域不断推陈出新,收获孩子家长们好评与认可?

其实,这背后离不开研发团队的创新和投入,以及多年来的经验积累。

早在2012年成立之初,猿辅导开始投入大量资源去做「猿题库」,并希望能用科技改变教育。

也就是从一开始,他们便设定了实现「自适应学习」的目标,并推出了首款线上教育产品。

其中,针对一个「推题」的功能,猿辅导曾尝试利用现有研究成果,比如项目反应理论等与教育质量相关的技术去实现,却发现在实际应用中的效果并不明显。

后来,他们通过不断实践发现,利用深度学习优化「推题」算法,可能会实现更好的效果。

CTO杨元祖曾在采访中表示,「猿辅导技术发展的时间节点有很多,最关键的节点是,做出了一个决策而非产品」。

而这个决策需要团队不断去探索,然后开始筹备团队,在2014年成立了首个AI Lab。

GPT-4发布之后,猿辅导决定去自研LLM。由此,才有了现在的AI场景测试。

旗下大模型已经形成多种参数规模和形态的模型矩阵,具备学情分析、作文辅导、阅读对话、计算解题等十几种核心教育能力。

除了以上提到的飞象星球、海豚AI学、猿辅导素养课,整个集团旗下,LLM还在斑马App、小猿学练机等教育类软硬件产品实现全面落地。

而下一步,猿辅导希望补齐教育大模型最后一块「拼图」——自研多模态大模型。

我们已经看到了,多模态GPT-4o在教育应用中的强大力量。发布当天,可汗学院的创始人父子,演示了GPT-4o如何像真人老师一步一步启发、鼓励,帮助男孩完成数学题。

几天前,OpenAI还发布了专为大学打造的教育版「ChatGPT Edu」,也得到了GTP-4o的加持。

足见,多模态模型对教育领域的重要性远超其他领域。CTO杨元祖也表示,猿辅导对多模态的期待和投入非常大。

不得不承认,教育领域的大模型,还处于发展的早期阶段,未来还有很长的一段路要走。这次的演示,也只是在测试阶段。他们还将继续探索在不同场景中的落地应用。

科技是否真的能改变中国2000多年的教育方式,或许还会面对更巨大的挑战。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的AI!
相关产品与服务
ICP备案
在中华人民共和国境内从事互联网信息服务的网站或APP主办者,应当依法履行备案手续。腾讯云为您提供高效便捷的 ICP 备案服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档