Facebook上的机器翻译也全面拥抱神经网络了

陈桦 编译整理 量子位 报道 | 公众号 QbitAI

Facebook今天宣布,他们已经完成了向神经机器翻译技术的迁移。

换句话说,Facebook目前开始使用卷积神经网络(CNN)和递归神经网络(RNN)去自动翻译Facebook平台上的内容。

Facebook使用Caffe2深度学习框架来部署他们的神经机器翻译,同时还把他们为这个项目开发的LSTM等RNN模块作为Caffe2的组件开源出来。

量子位立即去测试了一下,效果……还算能看懂:

谷歌、微软和Facebook开发神经机器翻译技术已有一段时间,这些公司同时也在抛弃老式基于短语的统计机器翻译技术。

相对基于短语的方法,基于神经网络的方法更有前景,而最重要的是这种方法能带来更准确的结果。

当然,“准确”只是相对的,神经网络仍需努力,比如说这段反驳“Facebook AI失控事件”文字:

传统机器翻译的原理很简单。利用关键短语,基于短语的系统可以翻译整个句子,随后通过概率方法来输出最终翻译结果。

与此不同,神经网络模型进行了层次更高的抽象化处理,将句子表达变成了多维向量表示的一部分。这意味着,系统尝试根据“上下文”,而不仅仅是短语来翻译。

这样的机制并不完美,研究者仍在探索,如何处理长期依赖关系(即在长文本中确保理解能力和准确性)。不过,这种方法仍然很有前景,并且已经带来了不错的结果。

2016年9月,谷歌宣布了向神经机器翻译发展的第一步。两个月后,微软也宣布了类似的消息。

ACL昨天评出的最佳论文奖之中,也有一项颁给了一篇神经机器翻译论文:OpenNMT。

Facebook在这方面的工作已持续了约1年,而目前正在启动技术的全面部署。

Facebook人工智能研究部门(FAIR)今年5月发表了自主研究结果,并在GitHub上开源了相关的CNN模型。

Facebook语言技术团队工程经理Necip Fazil Ayan表示:“我们的问题与大多数标准场合不同,这主要是由于我们在Facebook上看到的语言类型。我们看到了许多非正式用语和俚语缩写。语言的风格差异很大。”

利用新的神经机器翻译技术,Facebook的翻译质量提升了10%。

关于Facebook将CNN用于机器翻译的详情,见该公司博客文章: https://code.facebook.com/posts/289921871474277/transitioning-entirely-to-neural-machine-translation/

关于Caffe2的RNN模块: https://caffe2.ai/blog/2017/08/03/caffe2-adds-RNN-support.html

关于Facebook的CNN机器翻译,详情见 论文:https://fb.me/convolutional-s2s.pdf 代码:https://github.com/facebookresearch/fairseq

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-08-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

TensorFlow 工程总监 Quora 问答:深度学习系统瓶颈及用户痛点

【新智元导读】TensorFlow 工程总监Rajat Monga9月29日在Quora 上答疑,就深度学习效率瓶颈、TensorFlow 用户的痛点、如何用T...

420110
来自专栏AI科技评论

技术大牛带你走向机器学习“正道”:小朋友才迷信算法,大人们更重视工程实践

AI科技评论按:“算法”这两字在人工智能圈已然成为“高大上”的代名词,由于不少在校生和职场新人对它过度迷恋,多名 AI 资深人士均对这一现象表示担忧。李开复曾这...

39230
来自专栏人工智能头条

从YouTube算法论文反推其推荐机制

20820
来自专栏CDA数据分析师

避免五大误区丨数据科学家新手进阶之路

你为成为数据科学家做好了充分的准备。你参加Kaggle比赛,看了大量的Coursera课程。你感觉已经准备好了,但数据科学家的实际工作将与你的预期大不相同。

14500
来自专栏机器之心

前沿 | 不再需要动作捕捉,伯克利推出「看视频学杂技」的AI智能体

作者:Xue Bin (Jason) Peng 和 Angjoo Kanazawa

21230
来自专栏专知

381页机器学习数学基础PDF下载

【导读】近期,由Marc Peter Deisenroth,A Aldo Faisal和Cheng Soon Ong撰写的《机器学习数学基础》“Mathemat...

1.5K40
来自专栏人人都是极客

【视频教学】如何加速深度学习架构

有些人会觉得现在市场上有很多深度学习引擎的框架,比如tensorflow, pytorch, caffe等,为什么还需要加速呢,很简单,虽然深度学习的技术发展火...

11520
来自专栏人工智能快报

科学家研制出具有更好自学能力的计算机

物理研究门户网站phys.org发文称科学家开发出了一种基于神经启发的模拟计算机,它能够在执行任务时通过自我训练将自己变得更好。这个基于一种名为“储备池计算”的...

28460
来自专栏新智元

AI vs 深度学习 vs 机器学习:人工智能的 12 大应用场景

【新智元导读】在本文中,作者先探讨了深度学习的特点和优势,然后介绍了12种类型的AI问题,即:在哪些场景下应该使用人工智能(AI)?作者强调企业AI问题,因为他...

34850
来自专栏AI研习社

如何在 15 个月内占领 Kaggle 榜首?bestfitting 经验大放送

雷锋网 AI 研习社按:相信玩过 Kaggle 比赛的人都知道 bestfitting,他在加入 Kaggle 社群短短两年之内,就以黑马之姿成功占领比赛排行榜...

12420

扫码关注云+社区

领取腾讯云代金券