机器人批改作文 你觉得它能胜任吗?

都市快报消息,一篇200字不到的作文,机器人用几十秒时间找出了8处语法和用词错误。最近,在浙江外国语学院国际学院,来自俄罗斯、韩国、赞比亚等6个国家的11位外国留学生完成了一份特别的中文试卷,他们成为了全球首批用人工智能(AI)来阅卷的学生,而这款人工智能来自于阿里巴巴。

在考试前,老师布置了一道名为“请写一写你的爱好”的命题作文。半个小时后,同学们陆续交卷。接下来这个阅卷机器人开始工作。

先将试卷扫描,在后台图像被转化成文字出现在电脑上,几十秒之后,迅速在一篇200字不到的作文里圈出了8个错误。

这篇作文是这样写的:我的爱好是学中文,中文使我快乐。但中文的难点并非是字,而且像女朋友一样善变。比如,我到中国才知道了大姨妈不是人。而且,有一次我问舍友去吃饭不去,他说:我去,我才不去。我的内心是崩溃的。我问他“你这是什么意思?”他说:“没什么意思,意思意思。”我受到了上帝得暴击。然而,我的不会放弃的。除非中国人也放弃我才会放弃。听说这次的试卷是AI老师看的,如果他们会教给外国人学习中文是很好的消息。

在这份试卷上,阿里AI用代表不同意义的符号在试卷上,圈出多词(Redundant)、缺词(Missing)、错词(Selection)和词序错误(Word Order)等错误位置,完成了对作文的批改。

比如AI认为,“但中文的难点并非是字,而且像女朋友一样善变”这句话里有两个错误:“是”多用了,“而且”是错词。

浙江外国语学院外语系李老师说:“我们希望科技能够帮助外国留学生们理解中文。前两天正好在报纸上看到,阿里巴巴iDST人工智能在中文语法错误自动诊断大赛上夺得冠军,我们就试着邀请这个‘AI老师’帮助外国留学生学中文。没想到得到了回应。”

阿里巴巴的工程师透露,这款AI学习了几十万的中文语言体系,通过扫描仪读取试卷信息,使用OCR技术将其转换成文本,之后启动自然语言处理算法进行分析,并识别出错位类型和位置,最后批注在试卷上。整个过程大概只需约5秒。从目前的测试情况来看,阿里“AI老师”在准确率和细致程度都是接近甚至超乎人类的水平。

事实上,把AI应用到外国人学中文试卷批改上,是全球首例。11月24日,阿里巴巴iDST在中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军。

CGED是自然语言处理领域的权威赛事。比赛的背景是:学习中文的外国人数不断增加,由于中文的博大精深,外国友人在中文写作中会出现各种错误。主办方挑选了一些外国友人写的中文作文片段,希望参赛者用人工智能算法自动识别里面的语法语义错误。

阿里巴巴iDST自然语言处理首席科学家司罗说,中文语法诊断的挑战性在于,中文语言知识丰富、语法多样;人在判断一句话是否有错误的时候,会用到长期积累的知识体系(比如一句话是否通顺、两个词是否可以搭配、语义上是否成立等)。相比之下,比赛提供的训练数据非常有限,仅通过训练数据来识别错误是很困难的。

司罗团队横跨中国(杭州/北京)和美国(硅谷/西雅图),普遍拥有10年以上自然语言处理研发经验,30%以上有博士学历。团队多次在国际自然语言技术竞赛中取得冠军成绩。

本文来自企鹅号 - 重庆晨报媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

当,程序员突然想画画,AI+机器人就该登场了

但,理想和现实之间,可能远隔千山。比方,你其实没有创作的灵感。以及,你其实没有把灵感实现出来的基本技能。

723
来自专栏数据的力量

一个数据挖掘大牛,用程序算法做人生选择

1304
来自专栏Python数据科学

数据分析带你玩吃鸡,堡垒新手再也不会被劝退

本文转自 https://aaalvin.github.io/Personal-project/

671
来自专栏达观数据

不止你们可以吐槽高考作文,机器也可以!

在吐槽满屏的高考季,高考作文成最大槽点。如果我们放下人类的架子,从AI算法的角度来观察,会不会看到什么新奇的结果?小编向达观AI机器君投喂了近几年的高考命题和满...

3356
来自专栏斜述视角

《I Pencil》一文分享

生活在城市里的人,都非常喜欢大自然,经常赞叹大自然的美好与神奇,但对自己身边的生活却熟视无睹。其实人类社会有许多精彩的地方,只是我们缺乏慧眼去欣赏而已。就拿我们...

562
来自专栏玉树芝兰

白话开题报告写作

我让自己的研究生看了许多关于研究方法的书籍,并且要求写读后感。他们写读后感的时候一个个都很明白,真正到做开题报告就又糊涂了。

793
来自专栏ThoughtWorks

去腾讯去豆瓣去外企去国内的企业去创业去考研去北京回老家去创新工场去ThoughtWorks?

每年一到要找工作的时候,我就能收到很多人给我发来的邮件,总是问我怎么选择他们的offer,去腾讯还是去豆瓣,去外企还是去国内的企业,去创业还是去考研,来北京还是...

36510
来自专栏量子位

从0自学成AI高手,她只用了一个产假

上面这位母亲,名叫Nicole Finnie,现在是一位AI高手。前不久,她从全球数千人参与、奖金10万美元的DSB(Data Science Bowl)年度大...

833
来自专栏量子位

AI打星际2是怎么回事?快看看这段6分钟的视频讲解

允中 发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 去年年底,DeepMind宣布想教会AI智能体玩《星际争霸2》(后简称星际2),计划创造出能击败...

3108
来自专栏Petrichor的专栏

科普:论文上附有的 arXiv 是干嘛的

简单来说,为了防止自己的idea在论文被收录前被别人剽窃,我们会将预稿上传到arvix作为预收录,因此这就是个可以证明论文原创性(上传时间戳)的文档收录网站 。

1242

扫码关注云+社区