谷歌采用神经网络驱动机器翻译,可离线翻译59种语言

AiTechYun

编辑:chux

谷歌的在线翻译自2016年以来一直由神经机器翻译(NMT)驱动,今天,该公司推出了其神经网络驱动的方法,以便谷歌翻译的iOS和安卓应用用户能够更准确地实现59种语言的离线翻译。

谷歌产品经理Julie Cattiau表示,谷歌翻译小组与谷歌大脑团队一起使用TensorFlow完成了离线NMT。与其他谷歌应用不同,95%的谷歌翻译用户群不在美国境内,而在印度,巴西和印度尼西亚等国家。“所以我们从用户那里得到很多高质量的在线信息,但是他们中的很多人无法访问互联网连接,或者他们更愿意保存他们的数据计划。所以我们在过去的一年半时间里把它作为一项重点,将我们的NMT模型搭入人们的设备。”

与以前的机器学习方法通过扫描句子短语提供解释相比,NMT的离线翻译可以一次分析整个文本块,从而允许更自然、更和条理的声音,以及情境感知翻译。

连接到互联网时,谷歌翻译应用程序中的对话模式可以提供现场语音翻译。但是,NMT离线翻译是以纯文本翻译的形式发布,它不会扩展到翻译应用程序中的功能,比如解释拍摄的菜单或翻译声音。

为了使实时的语音翻译成为可能,谷歌必须使AI的其他元素结合起来,才能在离线状态下使用对话模式,比如语音识别以及将文字从文本合成到语音。

“这些部件中都需要在设备上进行构建,才能获得完整的体验,这绝对是我们想要推出的东西,”她说。“目前还没有确定日期,但文本翻译无疑是构建语音端到端离线翻译的基石之一。”

获得离线神经机器翻译不需要更新程序。之前下载了离线翻译软件包的用户将看到一条横幅,点击横幅就可以离线翻译,而新用户必须先进入该应用并选择他们想要离线使用的语言进行下载。每种语言包大约需要35-45 MB,大小与之前的离线包相当,但质量更高。

Cattiau说,“我们无法在低端手机上运行这些耗费大量计算能力的模型,因此需要工程师压缩模型并使其在非常低端的安卓设备上运行。这也是这次发布的挑战。”

用户应该注意到这与之前的离线翻译有所不同,但在线翻译仍然比离线翻译更准确,因为减少了语言包的空间。

与以前使用的基于短语的机器学习方法一样,NMT利用了数以亿计的文章,书籍,文档和搜索结果等示例翻译。

谷歌的语言能力不仅仅改进了翻译应用程序。Alphabet的子公司已承诺在今年年底前为谷歌智能助理提供30多种语言,这个数字远远超过支持4种语言的Alexa的和支持20种语言的Siri。

本文分享自微信公众号 - ATYUN订阅号(atyun_com)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-06-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏EAWorld

人工智能与软件架构

本文目录: 一、人工智能(AI)的目标是增强智能(IA),而不是替代人类 二、应对软件架构分而治之带来集成的挑战,探索智能的连接 三、从智能连接入手探索在软件架...

549110
来自专栏CDA数据分析师

避免这7个数据错误,让你的数据分析更有效率!

? 编译 Harris 本文转自机房360,转载需授权 数据正在成为现代企业的一个更重要的工具,几乎可以作为一种货币,它可以从衡量营销活动的有效性到评估员...

39080
来自专栏AI科技评论

八步拿下数据科学,攻克 “21世纪最性感的工作”

在数据科学(Data Science)领域,除了“什么是数据科学”这个问题以外,大家最感兴趣的问题就是“如何学习数据科学?”其实这个问题除了新手会问,有时候领域...

28570
来自专栏机器学习AI算法工程

想学习R语言却不知道如何学习,应该按何种步骤?

问题: 背景金融小硕,想学习R语言却不知道应该如何学习,应该按何种步骤,看哪些书或者视频资料等东西,所以提问这个问题,希望知道学习R语言的一般过程是怎样的,...

40940
来自专栏新智元

【八年苦读】伯克利研究生解决量子计算验证问题

新智元报道 来源:Quantamagazine 作者:Erica Klarreich 编辑:三石、肖琴

18370
来自专栏机器学习算法与Python学习

为什么程序员一定要学深度学习

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 对于深度学习,我也是一个初学者,能力...

36840
来自专栏大数据文摘

抛掉幻想,谈谈现实中的数据科学家

16030
来自专栏华章科技

关于Python的一切:2018年,你读这8本书就够了

导读:C++、Java大神Bruce Eckel前些天在中国之行中,毫不掩饰对Python的偏爱:“坦白来讲,我最喜欢的语言是Python。每当我有问题需要被解...

14310
来自专栏量子位

圣诞节吃饺子时,怎么给女票解释啥是AI?

Root 编译整理自 Wired 量子位 出品 | 公众号 QbitAI 上回的美图头像神器,大家有推荐给女票嘛? 把好看的照骗玩了一圈之后,可能她心里想问,感...

34970
来自专栏数据科学与人工智能

知识图谱的应用

导读 知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各...

1.4K80

扫码关注云+社区

领取腾讯云代金券