机器人批改作文 你觉得它能胜任吗?

都市快报消息,一篇200字不到的作文,机器人用几十秒时间找出了8处语法和用词错误。最近,在浙江外国语学院国际学院,来自俄罗斯、韩国、赞比亚等6个国家的11位外国留学生完成了一份特别的中文试卷,他们成为了全球首批用人工智能(AI)来阅卷的学生,而这款人工智能来自于阿里巴巴。

在考试前,老师布置了一道名为“请写一写你的爱好”的命题作文。半个小时后,同学们陆续交卷。接下来这个阅卷机器人开始工作。

先将试卷扫描,在后台图像被转化成文字出现在电脑上,几十秒之后,迅速在一篇200字不到的作文里圈出了8个错误。

这篇作文是这样写的:我的爱好是学中文,中文使我快乐。但中文的难点并非是字,而且像女朋友一样善变。比如,我到中国才知道了大姨妈不是人。而且,有一次我问舍友去吃饭不去,他说:我去,我才不去。我的内心是崩溃的。我问他“你这是什么意思?”他说:“没什么意思,意思意思。”我受到了上帝得暴击。然而,我的不会放弃的。除非中国人也放弃我才会放弃。听说这次的试卷是AI老师看的,如果他们会教给外国人学习中文是很好的消息。

在这份试卷上,阿里AI用代表不同意义的符号在试卷上,圈出多词(Redundant)、缺词(Missing)、错词(Selection)和词序错误(Word Order)等错误位置,完成了对作文的批改。

比如AI认为,“但中文的难点并非是字,而且像女朋友一样善变”这句话里有两个错误:“是”多用了,“而且”是错词。

浙江外国语学院外语系李老师说:“我们希望科技能够帮助外国留学生们理解中文。前两天正好在报纸上看到,阿里巴巴iDST人工智能在中文语法错误自动诊断大赛上夺得冠军,我们就试着邀请这个‘AI老师’帮助外国留学生学中文。没想到得到了回应。”

阿里巴巴的工程师透露,这款AI学习了几十万的中文语言体系,通过扫描仪读取试卷信息,使用OCR技术将其转换成文本,之后启动自然语言处理算法进行分析,并识别出错位类型和位置,最后批注在试卷上。整个过程大概只需约5秒。从目前的测试情况来看,阿里“AI老师”在准确率和细致程度都是接近甚至超乎人类的水平。

事实上,把AI应用到外国人学中文试卷批改上,是全球首例。11月24日,阿里巴巴iDST在中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军。

CGED是自然语言处理领域的权威赛事。比赛的背景是:学习中文的外国人数不断增加,由于中文的博大精深,外国友人在中文写作中会出现各种错误。主办方挑选了一些外国友人写的中文作文片段,希望参赛者用人工智能算法自动识别里面的语法语义错误。

阿里巴巴iDST自然语言处理首席科学家司罗说,中文语法诊断的挑战性在于,中文语言知识丰富、语法多样;人在判断一句话是否有错误的时候,会用到长期积累的知识体系(比如一句话是否通顺、两个词是否可以搭配、语义上是否成立等)。相比之下,比赛提供的训练数据非常有限,仅通过训练数据来识别错误是很困难的。

司罗团队横跨中国(杭州/北京)和美国(硅谷/西雅图),普遍拥有10年以上自然语言处理研发经验,30%以上有博士学历。团队多次在国际自然语言技术竞赛中取得冠军成绩。

本文来自企鹅号 - 重庆晨报媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

从概念到底层技术,一篇文看懂重塑世界的区块链

区块链是目前一个比较热门的新概念,蕴含了技术与金融两层概念。从技术角度来看,这是一个牺牲一致性效率且保证最终一致性的的分布式的数据库,当然这是比较片面的。从经济...

2926
来自专栏机器人网

200字作文机器人找出8处错误,你觉得它改得正确吗?

批改作文是非常令老师崩溃的一件事情,尤其是歪果仁,还是初学者。最近,浙江外国语学院国际学院把批改作文这件事情交给了机器人,据了解,这个AI机器人还非常高效,仅用...

2945
来自专栏All in Tech

别那么想,“区块链”不是寻找问题的解决方案

比特币使用区块链技术,对吧?是的,它确实。当然,你还记得2015年的言论:“我不确定比特币是否有意义,但我对它背后的底层技术——区块链感兴趣” ——曾经在某个网...

3386
来自专栏区块之恋

小白系列 | 浅析EOS共识过程1、什么是EOS2、什么是共识机制3、浅识EOS的共识机制4、优势和争议5、结论

1827
来自专栏企鹅号快讯

V神认为能够保障“网络中立”的不是VPN,而是大规模采用Mesh网络

网络中立的问题因为美国联邦通信委员会在12月15日废除了美国前总统奥巴马时期的网络中立性政策而被大家热议。 2015年奥巴马政府通过《开放互联网法令》,主要是要...

2177
来自专栏区块之恋

区块链学堂 | 深入浅出零知识证明一、什么是零知识证明?二、零知识证明的价值三、零知识证明的三个基本特性四、零知识证明的典范Zcash五、总结

2237
来自专栏区块链入门

【区块链+ABS实践】交行推出业内首个区块链资产证券化平台

6月23日,交通银行正式上线业内首个区块链资产证券化平台“聚财链”。通过在交行、交银国信部署区块链节点,同时交行为券商、评级、会计、律师等中介机构部署区块...

1791
来自专栏区块链领域

美女BTC月赚24.6%,用免费交易所多赚7800

第一,不要24小时看盘,只要没有突破区间,就不要管,不要想买在谷底,抛在峰顶,心态非常非常重要,再重复一遍,心态非常非常重要。

972
来自专栏企鹅号快讯

赤链——区块链底层技术革命

区块链至今为止发展了近10年的时间,尤其这两年得到全球范围内无论政府还是银行或者商业等等广泛认同,并大力推动区块链的应用和落地。目前以比特币和以太坊为代表的公有...

4405
来自专栏企鹅号快讯

什么是区块链?

关于“区块链”,有人以为只与比特币相关,其实不然,区块链是一种颠覆传统计算方法的新科技。传统计算和信息交流都有一个计算中心,而区块链却没有中心,凡是区块链上的任...

2058

扫码关注云+社区