前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Facebook上的机器翻译也全面拥抱神经网络了

Facebook上的机器翻译也全面拥抱神经网络了

作者头像
量子位
发布2018-03-28 15:12:39
7690
发布2018-03-28 15:12:39
举报
文章被收录于专栏:量子位量子位
陈桦 编译整理 量子位 报道 | 公众号 QbitAI

Facebook今天宣布,他们已经完成了向神经机器翻译技术的迁移。

换句话说,Facebook目前开始使用卷积神经网络(CNN)和递归神经网络(RNN)去自动翻译Facebook平台上的内容。

Facebook使用Caffe2深度学习框架来部署他们的神经机器翻译,同时还把他们为这个项目开发的LSTM等RNN模块作为Caffe2的组件开源出来。

量子位立即去测试了一下,效果……还算能看懂:

谷歌、微软和Facebook开发神经机器翻译技术已有一段时间,这些公司同时也在抛弃老式基于短语的统计机器翻译技术。

相对基于短语的方法,基于神经网络的方法更有前景,而最重要的是这种方法能带来更准确的结果。

当然,“准确”只是相对的,神经网络仍需努力,比如说这段反驳“Facebook AI失控事件”文字:

传统机器翻译的原理很简单。利用关键短语,基于短语的系统可以翻译整个句子,随后通过概率方法来输出最终翻译结果。

与此不同,神经网络模型进行了层次更高的抽象化处理,将句子表达变成了多维向量表示的一部分。这意味着,系统尝试根据“上下文”,而不仅仅是短语来翻译。

这样的机制并不完美,研究者仍在探索,如何处理长期依赖关系(即在长文本中确保理解能力和准确性)。不过,这种方法仍然很有前景,并且已经带来了不错的结果。

2016年9月,谷歌宣布了向神经机器翻译发展的第一步。两个月后,微软也宣布了类似的消息。

ACL昨天评出的最佳论文奖之中,也有一项颁给了一篇神经机器翻译论文:OpenNMT。

Facebook在这方面的工作已持续了约1年,而目前正在启动技术的全面部署。

Facebook人工智能研究部门(FAIR)今年5月发表了自主研究结果,并在GitHub上开源了相关的CNN模型。

Facebook语言技术团队工程经理Necip Fazil Ayan表示:“我们的问题与大多数标准场合不同,这主要是由于我们在Facebook上看到的语言类型。我们看到了许多非正式用语和俚语缩写。语言的风格差异很大。”

利用新的神经机器翻译技术,Facebook的翻译质量提升了10%。

关于Facebook将CNN用于机器翻译的详情,见该公司博客文章: https://code.facebook.com/posts/289921871474277/transitioning-entirely-to-neural-machine-translation/

关于Caffe2的RNN模块: https://caffe2.ai/blog/2017/08/03/caffe2-adds-RNN-support.html

关于Facebook的CNN机器翻译,详情见 论文:https://fb.me/convolutional-s2s.pdf 代码:https://github.com/facebookresearch/fairseq

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-08-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 陈桦 编译整理 量子位 报道 | 公众号 QbitAI
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档