学界 | 百度机器同传系统新突破:可预测译文、延迟可控

机器之心报道

机器之心编辑部

由于不同语言之间存在词序差异,同步性要求较高的同声传译一直是困扰机器翻译的一大难题。使用传统的机器翻译方法至少会出现一个句子的延迟,导致用户无法与说话者同步。针对这一挑战,百度推出了首个拥有预判能力和可控延迟的机器同传翻译系统——STACL,以很小的质量损失获得了较小的延迟。

百度的 STACL(Simultaneous Translation with Anticipation and Controllable Latency)是首个拥有预判能力和可控延迟的机器同传翻译系统。它是一个能够进行高质量双语同传的自动系统,代表了自然语言处理方向的重大突破。这一技术的挑战很大一部分在于源语和目标语之间的次序差异以及现实世界同传应用的延迟需求。

我们一般把口译分为两种类型:

  1. 交替传译。译员要等到说话者停顿(通常在句子结尾停顿)时才开始翻译,因此需要双倍的时间完成交流过程。
  2. 同声传译。译员在说话者开始之后的几秒就开始翻译,并在他/她结束之后的几秒内停止翻译。

由于节省时间,同声传译被广泛应用于政府峰会、多边磋商及许多其它场合。同声传译的优势为其创造了大量需求,但同传译员的数量远远不够。而且每个译员只能工作一小段时间,之后他们的错误就会急剧增加,因此同传译员工作时都是两人或三人一组,每 20-30 分钟替换一下。

因此,迫切需要开发自动化系统来扩充同声传译的力量。

创造一个自动化系统进行可靠的同声传译是长期困扰这一领域的一大难题,源语和目的语之间的次序差异尤其难以克服。例如,这里有一个中文句子「布什总统在莫斯科与普京会晤」,中文词「会晤」出现在句末,与德语或日语动词类似。然而在其英语译文中,动词「meet」出现得要早得多。这种语言次序上的差异对于同传译员和可靠的机器同传系统来说都是很大的障碍。因此,几乎所有的「实时」翻译系统今天都还在使用传统的整句(即非同步)翻译方法,导致系统出现至少一个句子的延迟,使得用户无法与说话者同步。

我们受同传译员的启发想办法解决了这个难题,他们通常会预测演讲者接下来要讲的内容。但与同传译员不同的是,我们的模型预测的不是演讲者的源语言,而是直接预测翻译的目标语言,这样它就能够在一个「wait-k」模型中无缝融合译文和预测内容。在这个模型中,翻译总是延迟 k 个词,以预测一些上下文。我们训练模型在每个步骤(以及迄今为止的翻译)使用源语中的可用前缀来决定翻译中的下一个单词。在前面提到的例子中,鉴于中文前缀「布什总统在莫斯科」和此时的英语翻译「-P-resident Bush」(K=2,比中文延迟两个词),我们的系统准确地在下一个中文动词出现之前预测了下一个译文单词是「meet」,因为布什很可能在莫斯科「meeting」某人(比如普京)。就像人工同传需要提前了解演讲者的主题和风格一样,我们的模型也需要用大量具有相似句子结构的训练数据来训练,以进行合理的预测。

STACL 在延迟-质量的权衡方面也很灵活,用户可以任意指定延迟要求(如,一字延迟或五字延迟)。在法语和西语等密切相关的语言之间,延迟可以设置得更短,因为即使是逐字翻译也效果不错。然而,对于差异很大(如汉语和英语)以及语序不同的语言(如英语和德语),则需要更长的延迟来应对语序差异。翻译质量很容易受到短延迟的影响,但是与传统的整句(即非同步)翻译相比,我们的系统质量损失很小。对于短延迟要求,我们将继续提高翻译质量。

据说最好的同传译员可以传达 60% 的源材料信息(大约 3 秒钟的延迟),而百度的新同传系统比传统的整句翻译少了 3.4 个 BLEU 点(BLEU 是通过比较机器翻译结果和人工翻译来衡量整句翻译质量的标准评估指标)。在采用等待三词模式(wait-3-words model,指英语翻译比汉语语音落后三个汉字,约 1.5-2 秒的延迟)的汉英同传中,翻译质量的单一参考 BLEU 分数为 15.3 分,而传统的整句(非同步)翻译要高出 5 分左右。如果允许五个字(约 3 秒)的延迟,这种准确率差异会缩小到 3.4 分左右。

虽然这是最新进展,我们也完全意识到了机器同传系统的很多局限性。STACL 的发布没有打算取代人类译员,而是让同传变得更容易实现,人类译员在未来很多年仍然是翻译市场的主力军。

想了解更多关于 STACL 的信息,请看论文:

论文:STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency

论文地址:https://arxiv.org/pdf/1810.08398v1.pdf

摘要:同传在很多场景中都非常实用,但由于词序的差异和同步的要求,同传也非常难以实现。本文介绍了一种非常简单但效果惊人的「wait-k」模型,训练该模型在听到源语句的同时生成目标语句,但是通常会有 k 个词的延迟。该框架将预测内容和翻译无缝地集成在一个模型中,该模型是对现有神经翻译框架微调之后获得的。与整句的非同传相比,本文中的汉英同传实验需要五个词的延迟,质量下降了 3.4(单一参考)个 BLEU 值。此外,我们还制定了一个新的延迟度量来弥补以前的不足。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-10-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏北京马哥教育

稳稳吃鸡!用Python可视化分析 ”绝地求生1800万游戏数据“,

经常玩吃鸡游戏,我们现在来分析一下过去一年 1800万条游戏数据,看看有什么套路帮我们吃到鸡。

6812
来自专栏AI研习社

进化策略让 AI 开挂,玩游戏不断给自己续命

强化学习会通过在系统中选择一系列的行为,把分数提到最高水平。我们可以将这类技术运用于训练一种可以打爆各种各样游戏的人工智能,例如在 Q bert 游戏中,人工智...

872
来自专栏FreeBuf

走在路上能被识别人脸,该为高科技而喜还是为隐私而忧?

You’ll never find us. But victim or perpetrator, if your number is up, we’ll fin...

2985
来自专栏AI科技评论

视频 | 进化策略让AI开挂,玩游戏不断给自己续命

针对部分具有挑战性的深度强化学习问题,比如雅达利游戏,已经有研究表明,进化策略(Evolution Strategies)是强化学习的可行替代方案。

1012
来自专栏DT数据侠

自己动手,丰衣足食:我为博物馆造了一个推荐系统

通过收集分析参观者的行为数据,数据侠Belinda设计了一套简单的推荐系统,让一家老牌传统博物馆重新变得鲜活起来。你不用担心在参观时,会被博物馆卷帙浩繁的历史厚...

840
来自专栏小小挖掘机

COR“竞争市场条件下航班计划策略研究”论文解析

本文是针对发表在《Computers & Operations Research(计算与运筹)》上的一篇论文 “Airline flight schedule ...

3505
来自专栏机器人网

工业机器人的三头六臂(常用运动学构形)

一、常用运动学构形 1、笛卡尔操作臂 优点:很容易通过计算机控制实现,容易达到高精度。 缺点:妨碍工作, 且占地面积大, 运动速度低, 密封性不好。 ①焊接、...

3407
来自专栏CreateAMind

狂扫谷歌tesla的开源自动驾驶!

2121
来自专栏量子位

《黑镜》黑科技成真 | 解码脑电信号,AI重构脑中的画面

原作 TIM COLLINS Root 编译自 Dailymail 量子位 出品 | 公众号 QbitAI 上周五,一贯借黑科技刻画人性阴暗面的英剧《黑镜》刚出...

3309
来自专栏量子位

这个变态级难度的小游戏,只为证明:人类的聪明没那么简单

先别说话。 给自己几分钟的时间,玩一下这个游戏,看看是否能顺利通关。几分钟就好,别为难自己。因为普通人通关平均需要20分钟。 游戏地址:https://high...

3586

扫码关注云+社区

领取腾讯云代金券