谷歌开源神经机器翻译技术,推出tf-seq2seq框架

陈桦 编译自 Google官方博客 量子位 报道 | 公众号 QbitAI

谷歌研究软件工程师、谷歌大脑团队成员Anna Goldie和Denny Britz今天撰文,宣布在“谷歌神经机器翻译”的基础上推出开源框架tf-seq2seq,给外部研究人员提供帮助。

tf-seq2seq相关链接

项目介绍:https://google.github.io/seq2seq/

GitHub:https://github.com/google/seq2seq

以下是Google官方博客上发布的全文:

去年,我们宣布了“谷歌神经机器翻译”(GNMT)项目,这是一种“语句到语句”(seq2seq)模型,目前已被用在谷歌翻译系统中。尽管GNMT在翻译质量方面取得了长足进步,但由于模型的训练框架没有被开放给外部研究人员,因此其影响力存在局限。

今天,我们很高兴发布tf-seq2seq。这是TensorFlow内开源的语句到语句框架,帮助外部人士更方便地试验语句到语句模型,并取得最先进水平的成果。为了实现这一目标,我们会确保tf-seq2seq的代码库干净、模块化,确保完整的测试覆盖,并在文档中记录所有功能。

我们的框架支持标准语句到语句模型的不同配置,例如编解码深度,注意力机制、RNN元素类型,或束尺寸。正如我们的论文《神经机器翻译架构的大规模探索》(https://arxiv.org/pdf/1703.03906.pdf)中所说,这样的灵活性帮助我们发现优化的超参数,并能够胜过其他框架。

语句到语句模型能进行中英文之间的翻译。在每一步中,编码器获取一个中文字符及其之前的状态(黑色箭头),并生成一个输出向量(蓝色箭头)。解码器随后逐个单词地生成英文翻译结果。每一步都会获取最后一个单词、之前的状态,以及对编码器所有输出结果的加权合并,随后生成下一英文单词。请注意,在我们的配置中,我们使用公共字子单元(Wordpieces)来处理罕见字。

除机器翻译之外,tf-seq2seq还可应用于其他任何语句到语句任务(例如学会根据给定的输入语句生成输出语句),包括机器归纳,图片标识、语音识别,以及会话建模。我们的对框架的设计确保了通用性,并提供了教程、预处理数据,以及用于机器翻译的其他工具。

我们希望,tf-seq2seq能帮助你们加速(或启动)自己的深度学习研究,这个系统的Github页面上还有多个开放的问题,欢迎你们提供帮助,为其做出贡献。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-04-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

业界 | 微软推出深度学习加速平台「Project Brainwave」:FPGA驱动实时人工智能

选自微软博客 机器之心编译 参与:路雪、黄小天、蒋思源 近日在 Hot Chips 2017 上,微软团队推出了一个新的深度学习加速平台,其代号为脑波计划(Pr...

36970
来自专栏AI科技评论

开发 | 还在费心学编程?微软用深度学习 AI 帮你写代码

在过去的几十年中,无论在硬件组织还是软件架构上,计算机行业已经发生了翻天覆地的变化,各种软硬件产品的性能和用户体验均得到了显著提升。 但对程序员而言,软件编码的...

46390
来自专栏CSDN技术头条

数据专家必知必会的7款Python工具

如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题。在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在...

24760
来自专栏瓜大三哥

matlab基础1

matlab简介 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要...

245100
来自专栏华章科技

数据专家必知必会的7款Python工具

我咨询了我们真正的数据专家,收集整理了他们认为所有数据专家都应该会的七款 Python 工具。The Galvanize Data Science 和 Galv...

11530
来自专栏数据科学与人工智能

【Python环境】首席数据专家们推荐使用的 7 款 Python 工具

如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题。在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在...

27950
来自专栏Albert陈凯

NO

N ---- 非关系型数据库( Not Only SQL):这个词听起来几乎就是「SQL,结构化查询语言」的反义词,SQL 是传统的关系型数据管理系统(RDBM...

27960
来自专栏java一日一条

如何用Python写一个贪吃蛇AI

这两天在网上看到一张让人涨姿势的图片,图片中展示的是贪吃蛇游戏, 估计大部分人都玩过。但如果仅仅是贪吃蛇游戏,那么它就没有什么让人涨姿势的地方了。 问题的关键在...

31220
来自专栏机器之心

资源 | DMLC团队发布GluonCV和GluonNLP:两种简单易用的DL工具箱

选自 Gluon 机器之心编译 参与:思源、李亚洲 近日,DMLC 发布了简单易用的深度学习工具箱 GluonCV 和 GluonNLP,它们分别为计算机视觉和...

32480
来自专栏AI研习社

Pytorch 0.3发布:实现多方面提速,增加对ONNX支持 | 快讯

2017 年初,Facebook 在机器学习和科学计算工具 Torch 的基础上,针对 Python 语言发布了一个全新的机器学习工具包 PyTorch。一经发...

36440

扫码关注云+社区

领取腾讯云代金券