首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

你的英语不行!微软亚研自动语法纠错系统达到人类水平

用于语法纠错(GEC)的序列到序列(seq2seq)模型(Cho et al., 2014; Sutskever et al., 2014)近年来吸引了越来越多的注意力(Yuan & Briscoe, 2016; Xie et al., 2016; Ji et al., 2017; Schmaltz et al., 2017; Sakaguchi et al., 2017; Chollampatt & Ng, 2018)。但是,大部分用于 GEC 的 seq2seq 模型存在两个缺陷。第一,seq2seq 模型的训练过程中使用的纠错句对有限,如图 1(a)所示。受训练数据的限制,具备数百万参数的模型也可能无法实现良好的泛化。因此,如果一个句子和训练实例有些微的不同,则此类模型通常无法完美地修改句子,如图 1(b)所示。第二,seq2seq 模型通常无法通过单轮 seq2seq 推断完美地修改有很多语法错误的句子,如图 1(b)和图 1(c)所示,因为句子中的一些错误可能使语境变得奇怪,会误导模型修改其他错误。

01

[变革]上海统计局与一号店、上海钢联战略合作

原标题:上海统计,在拥抱大数据时代中变革 “ 一个大规模生产、分享和利用大数据的时代正在来临。这是一个浩浩荡荡不可阻挡的历史潮流,谁拥有了大数据,谁就占领了制高点,取得了主动权。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础;就企业来说,谁能够有效应用大数据,谁就占得了市场,赢得了机遇。现在许多发达国家纷纷将大数据利用提升到了重要的国家战略层面,我们也要适应这一大势,将大数据视为国家战略资源,主动拥抱大数据时代,积极抢抓机遇、应对挑战。”这是国家统计局局长马建堂在国家统计局与11家企业在

010
领券