同声传译要失业了？百度发布AI即时翻译“神器”！

文章来源：企鹅号 - 我是小胡啊小胡

比如，法语和西班牙语这种较为接近的语言，延迟可设置在比较低的水平；但是，对于英语和汉语这种差异较大的语言，以及英语和德语这种词序不同的语言，延迟应当设置为较高水平，以便于更好的应对差异

人工智能领域，两种语言的“即时互译”是一项难以攻克的技术问题，其主要原因在于源语言和目标语言之间存在较大的词序和语序差异。近日，百度研发了具备预测能力和可控延迟的即时机器翻译系统，可实现两种语言之间的高质量、低延迟翻译。这是自然语言处理方面的重大技术突破，将对机器即时笔译和口译的发展起到极大地推动作用。

机器同传利用语音识别技术自动识别演讲者的讲话内容，将语音转化为文字，然后调用机器翻译引擎，将文字翻译为目标语言，显示在大屏幕或者通过语音合成播放出来。相比人类译员，机器最大的优势是不会因为疲倦而导致译出率下降，能将所有“听到”的句子全部翻译出来，这使得机器的“译出率”可以达到100%，远高于人类译员的60%-70%。同时，在价格上也占有优势。

在语音识别方面，区别于传统的上下文相关建模技术，百度提出了上下文无关音素组合的中英文混合建模单元，包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

在翻译质量方面，提出了“语音容错”的对抗训练翻译模型，根据语音识别模型常犯的错误，在训练数据中有针对性的加入噪声数据，使得模型在接收到错误的语音识别结果时，也能够在译文中纠正过来。比如，语音识别系统将“大堂”错误的识别为“大唐”，这一对噪声词将被自动收录到训练数据中，并将源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”，而保持目标语言翻译不变“Let's meet at the lobby of the hotel”，同时将这两个中文句子用于训练，进而获得具有更强的容错能力模型。

为了降低时延提升翻译质量，人类译员通常对演讲内容进行合理预测，百度开发人员从人类译员身上获得启示，研发了“wait-k words”模型，可以根据历史信息，直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡，用户可通过根据实际需求设定延迟时间（例如延迟1（k=1）词或延迟5(k=5)词）。比如，法语和西班牙语这种较为接近的语言，延迟可设置在比较低的水平；但是，对于英语和汉语这种差异较大的语言，以及英语和德语这种词序不同的语言，延迟应当设置为较高水平，以便于更好的应对差异。

在同声传译时，经常会遇到不同领域的专业知识，这就要求同传人员在短时间内吸收大量相关领域的内容，这对他们也是极大地挑战。基于此，百度模仿人类同传的准备过程，提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据，训练得到的具有通用翻译能力的模型；当它接到某一个领域的同传翻译任务时，系统会收集该领域数据并在通用模型的基础上进行增强训练，得到相应领域增的强模型；最后对该领域术语库进行强制解码，使专业术语翻译得准确可靠，且提升翻译效率。

作为对外开放和商业国际化的需求之一，同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合，但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题，越来越多开发者专注于机器同传的研发，百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。

虽然机器同传有了新的突破，但它与经验丰富的同传人员相比，依然存在一定差距。百度翻译技术负责人表示，同传的目的并不在于取代人类译员，而是为了降低同传成本，让同传的应用范围更加广泛，也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

发表于: 2018-10-252018-10-25 01:02:49
原文链接：https://kuaibao.qq.com/s/20181025A02QDL00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

同声传译要失业了？百度发布AI即时翻译“神器”！

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐