机器翻译终将攻克!微软中-英新闻翻译系统达到专业译者水平

高层速读

关键信息:微软亚洲研究院宣布开发出第一个机器翻译系统,该系统在通用新闻报道测试集newstest2017的中-英测试集上达到了人类水平,在自然语言处理上,实现了媲美人类专业译者的里程碑式突破。

由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队周三宣布,他们已经开发出了第一个机器翻译系统,该系统在通用新闻报道测试集newstest2017的中-英测试集上达到了人类水平。当100分是标准满分时,微软的系统得分69.9,专业译者68.6

微软表示,他们对来自各种在线报纸的大约2000个句子样本进行了反复测试,并将测试结果与机器翻译的结果进行了比较,甚至聘请了双语语言顾问,以进一步验证机器翻译的准确性。

首个媲美人类专业译者的里程碑式突破

这个名为newstest 2017的数据集是去年秋天在WMT 17的研究会议上发布的,由专业人员从在线报纸样本翻译而来,因此,研究人员能够如此迅速地达到这一成果,可以说是机器翻译领域的里程碑,特别是机器翻译是人们几十年来一直试图解决的问题。微软指出,许多人甚至认为,机器翻译与人类水平相同的目标永远不会实现。

黄学东院士在微软的博文中表示:“在机器翻译任务中,实现人与人之间的平等是我们所有人的梦想,我们只是没想到这么快就能成功。”同时研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终极目标又更近了一步。

▲黄学东,微软技术院士,负责自然语言和机器翻译工作

近年来,人工智能和语音识别技术的进步使得语音助理能够进入我们的手机和家庭,帮助消费者完成日常的计算任务,控制智能家居设备,以及聊天和娱乐。但是,对网页或新闻文章进行机器翻译,仍然会造成难以理解的语言上的混乱。因为机器翻译最多能准确翻译字面意思,但几乎不可能用任何深刻的语言来供你深入理解文章。要想真正理解长篇文章,你需要人的帮助。

但,即使是不同的译者,翻译一个句子的方式也可能略有不同,你不能说两者谁对谁错。“机器翻译要比单纯的模式识别任务复杂得多”微软亚洲副院长、从事该项目的自然语言处理小组负责人周明说,“人们可以用不同的词来表达完全相同的东西,但你不一定能说哪个更好。”

▲周明,微软亚洲研究院副院长,自然语言处理负责人

深度神经网络使翻译更加流畅、自然

微软还指出,人工智能的最新技术——深度神经网络,为研究人员实现了这一突破做出了贡献。深层神经网络是一种训练人工智能系统的方法,使研究人员能够创造出更流畅、更自然的翻译。考虑到更广泛的使用场景,以前的方法称为统计机器翻译。

微软的研究人员在系统中添加了自己的训练方法,以提高系统的准确性,这相当于人们一次又一次地检查自己的翻译作业,以确保它是正确的。

周明表示,“由于翻译没有唯一的标准答案,它更像是一种艺术,因此需要更加复杂的算法和系统去应对。”自然语言计算组基于之前的研究积累,在此次的系统模型中增加了另外两项新技术:联合训练(Joint Training)和一致性规范(Agreement Regularization),以提高翻译的准确性。

联合训练可以理解为用迭代的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。

▲微软中-英翻译系统试用界面

这一机器翻译研究成果可以应用到人工智能的各个领域中”周明说。此外,它今后还将能够准确、自然地翻译其他语言,同时应用到微软的商用多语言翻译系统产品中。

除了微软,谷歌的研究人员也一直在致力于机器翻译,包括使用神经网络的中英文查询机器学习技术。这些技术已经被用于改进谷歌面向消费者的产品中,比如谷歌翻译的App,以及谷歌搜索。

分享这篇文章

与同仁共同探讨AI行业动向

往期文章

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180315G1GZ8G00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券