展开

关键词

07:机器翻译

7:机器翻译 总时间限制: 1000ms 内存限制: 65536kB描述 小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。

87060

RNN与机器翻译

---- CS224d-Day 9: GRUs and LSTMs -- for machine translation 视频链接 课件链接 ---- 本文结构: 机器翻译系统整体的认识 什么是 parallel corpora 三个模块 各模块有什么难点 RNN 模型 最简单的 RNN 模型 扩展模型 GRU: LSTM ---- 下面是video的笔记: 1.机器翻译 机器翻译是 这只是一个简单的概括,机器翻译是个很庞大的系统,由不同的模型组成,分别处理不同的问题,还有很多重要的细节这里都没有讲。 2. RNN模型 那么 深度学习 可以简化这个系统吗? 只用一个 RNN 就能做到机器翻译吗?目前还没有达到这个水平,最新的一篇文章,还没有超过最好的机器翻译系统。 RNN与机器翻译 Day 10. 用 Recursive Neural Networks 得到分析树 Day 11. RNN的高级应用

70150
  • 广告
    关闭

    【玩转 Cloud Studio】有奖调研征文,千元豪礼等你拿!

    想听听你玩转的独门秘籍,更有机械键盘、鹅厂公仔、CODING 定制公仔等你来拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    业界 | 搜狗机器翻译团队获得 WMT 2017 中英机器翻译冠军

    WMT 是机器翻译领域的国际顶级评测比赛之一。 事实上,WMT 是一个开始自 2006 年 ACL 的国际机器翻译研讨会,提供统一的数据集,内容通常集中于新闻,并将结果以竞赛的形式呈现出来,旨在促进机器翻译研究机构之间的学术交流和联系,推动机器翻译研究和技术的发展 ,机器翻译顶级论文中已经几乎难以见到统计机器翻译的身影,神经机器翻译已经成为了机器翻译领域的主流。 SogouNMT 系统创新性地将许多自然语言处理门类中非翻译任务的方法用于机器翻译中,通过向神经网络添加额外的机器学习模块来提升质量来点对点解决神经机器翻译中的具体问题。 WMT 国际机器翻译评测中获得中英翻译的冠军。

    681130

    浅谈神经机器翻译

    最近,在被形象地命名为神经机器翻译的领域中,深度神经网络模型取得了最新的进展。 通过这篇文章,你将发现机器翻译的挑战性以及神经机器翻译模型的有效性。 什么是机器翻译机器翻译是将一种语言的源文本自动转换为另一种语言的文本的工作。 在一次机器翻译任务中,输入已经由某一种语言的符号序列组成,然后计算机程序必须将其转换成另一种语言的符号序列。 传统机器翻译方法的关键局限性在于制定语法所需的专业知识,以及所需的大量语法规则和特殊的例外。 什么是统计机器翻译? 使用关注机制的编码器 - 解码器递归神经网络结构目前在机器翻译的一些基准问题上是处于领先状态的。而且这种架构也被用在谷歌神经机器翻译系统(GNMT)的核心部分,并在他们的谷歌翻译服务中使用。 总结 在这篇文章中,您了解了机器翻译的挑战性以及神经机器翻译模型的效率性。 具体来说,你学习了: 鉴于人类语言固有的模糊性和灵活性,机器翻译是具有挑战性的。

    39280

    【玩转腾讯云】【腾讯云机器翻译TMT】机器翻译入门

    通过本文你可以学到什么 如何调用机器翻译接口 通过API 3.0 Explore体验机器翻译 通过API 3.0 SDK调用机器翻译接口 通过自行鉴权调用机器翻译接口及类似API3.0接口 前置准备 我们在准备调用机器翻译接口前 ,需要一些准备工作,主要包括 注册腾讯云账号 开通机器翻译服务 申请安全凭证 以下为各步骤的详细功能 1. 开通机器翻译服务机器翻译控制台https://console.cloud.tencent.com/tmt开通机器翻译服务 因笔者已经开通机器翻译服务,所以截取了语音合成的控制台,机器翻译的开通界面类似 https://cloud.tencent.com/document/api/213/15693的第一步即可 [截屏2020-05-02 下午4.26.06.png] 通过API 3.0 Explore体验机器翻译 Product=tmt&Version=2018-03-21&Action=TextTranslate&SignVersion=可以直接前往机器翻译的文本翻译界面 [截屏2020-05-02 下午4.45.19

    2.8K2415

    浅谈神经机器翻译

    最近, 深度神经网络模型在命名为神经机器翻译的领域中获得了最先进的成果. 在这篇文章中, 您将发现机器翻译的挑战性和神经机器翻译模型的有效性. 自然语言处理和机器翻译手册, 第133页, 2011年. 传统机器翻译方法的关键局限性在于制定规则所需的专业知识以及海量的规则和例外. 什么是统计机器翻译? 什么是神经机器翻译? 神经机器翻译(Neural machine translation, 简称NMT)是利用神经网络模型来学习机器翻译的统计模型. 而且这种架构被用作谷歌神经机器翻译系统(Google Neural Machine Translation, GNMT)的核心架构, 在他们的谷歌翻译服务中使用. ...目前最先进的机器翻译系统是由采用注意机制的模型提供支持 用于基于短语的统计机器翻译的连续空间翻译模型, 2013. 补充 机器翻译档案 神经机器翻译 - 维基百科 第13章, 神经机器翻译, 统计机器翻译, 2017.

    1.9K51

    机器翻译的前世今生

    人工翻译所耗费的成本巨大,也许最好的解决方法就是:充分利用机器翻译技术提供智能自动翻译服务。机器不会累、学习快,一个系统同时掌握十几种语言互译也不是问题,也许永远不会像人一样出现翻译盲点。 该报告全面否定了机器翻译的可行性,并宣称“在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的”。受此报告影响,各类机器翻译项目锐减,机器翻译的研究出现了空前的萧条。 复苏 进入二十世纪七十年代中后期,随着计算机技术和语言学的发展以及社会信息服务的需求,机器翻译才开始复苏并日渐繁荣。 Google于2011年1月正式在其Android系统上推出了升级版的机器翻译服务,现在,谷歌翻译已经可以在超过70种语言之间进行互相翻译。在2012年,谷歌翻译的用户使用量大约为2亿次。 到目前为止,这项服务还是免费的。但对于一项自动化的翻译服务来说,跨国公司将会乐于使用这种服务,从而为其带来很高的价值,这意味着在未来谷歌几乎肯定可以通过这种翻译工具获取大量收入。

    63560

    机器翻译的Attention机制

    机器翻译(Neural Machine Translation)中,Seq2Seq模型将源序列映射到目标序列,其中Encoder部分将源序列编码为Context Vector传递给Decoder,Decoder Encoder-decoder architecture 在输入序列很长的情况,在预测目标序列的时候,Attention机制可以使得Model能够将注意力集中在关键的相关词上,从而提升机器翻译模型的效果 initialize_hidden_state(self): return tf.zeros((self.batch_sz, self.enc_units)) Optimizer和Loss Function Seq2Seq的方法把机器翻译问题转换成一个分类问题

    8020

    机器翻译之BLEU值

    BLEU 分数 运行示例 双语评估替换评分 双语评估替换分数 (简称 BLEU) 是一种对生成语句进行评估的指标 完美匹配的得分为 1.0, 而完全不匹配则得分为 0.0 这种评分标准是为了评估自动机器翻译系统的预测结果而开发的尽管它还没做到尽善尽美 Translation,2002 年发表 n 元组匹配的计数结果会被修改, 以确保将参考文本中的单词都考虑在内, 而不会对产生大量合理词汇的候选翻译进行加分在 BLEU 论文中这被称之为修正的 n 元组精度 糟糕的是, 机器翻译系统可能会生成过多的合理单词 Translation,2002 年发表 nltk.translate.bleu_score 的源码 nltk.translate 包的 API 文档 总结 在本教程中, 你探索了 BLEU 评分, 根据在机器翻译和其他语言生成任务中的参考文本对候选文本进行评估和评分

    73730

    机器翻译之浅薄

    以我跟机器翻译软件打交道的经验,它们的翻译效果我一直持高度怀疑态度,但这两人却不以为然。事实上,很多很有头脑的人都是翻译软件的拥趸,极少去苛责机器翻译的浅薄,这让我很是不解。 全球每一个人都可以免费使用这项服务,它可以在大约 100 种语言之间任意翻译。这一点确实令人类自感羞愧。 况且,Google 翻译还可以时刻不停地为全球用户提供多种语言翻译服务。 ? Google 翻译的实用价值毋庸置疑,总体来说它还是个不错的产品。 Google 翻译无法像我一样利用 Google 搜索的服务,这是不是很可惜?虽然 Google 翻译可以在眨眼之间翻译网页,但是它无法理解这些网页的内容。它能吗? 虽然我持否定态度,但是仍有很多人对 Google 翻译提供的服务评价很高:它将语言 A 写就的有意义文本简单快速地转换为了由语言 B 组成的意义并不明显的文本。

    55060

    谷歌发布神经机器翻译

    除此之外,谷歌的一位发言人在邮件中告诉VentureBeat,最新的神经机器翻译是他们努力研发深度学习功能和机制的成果。 谷歌的神经机器翻译(GNMT)对八层长的短时记忆递归神经网络(LSTM-RNNs)的依赖性很强。“通过层间残留联系可以加强梯度流。”谷歌的科学家在他们发表的学术论文中写道。 虽然神经机器翻译并不永远是最佳之选,但是从谷歌的各种尝试中我们不难发现,在某些情况下,神经机器翻译还是有其过人之处的。 ? “神经机器翻译还是会犯一些笔译人员永远都不可能犯的错误,比如遗漏了一些单词、把一些常见的名字或是少见的专有名词翻错、对文章的语境缺乏整体把控等等。所以,我们还是有很大的进步空间。 但不可否认的是,神经机器翻译真的具有里程碑意义。”

    43170

    机器翻译界的BERT:可快速得到任意机器翻译模型的mRASP

    机器翻译预训练的挑战 目前绝大多数AI任务都是建立在数据的基础之上的统计学习,模型的表现效果很大程度上依赖于数据的质量和数量。 MASS和机器翻译示意图对比 上图对比分析了之前NLP预训练方法在机器翻译场景直接应用的限制。 BERT和GPT分别对应了Transformer[5] 编码器部分和解码器部分的预训练,而机器翻译用的是序列生成模型。 如何克服着两个问题,成了预训练模型在机器翻译领域应用的重要挑战。 2. 作者:潘小小 字节跳动AI-Lab NLP算法工程师,目前专注多语言机器翻译,法国留学文艺女青年,现居上海。

    39330

    神经机器翻译的Subword技术

    神经网络机器翻译(NMT)是目前最先进的机器翻译技术,通过神经网络的处理可以产生流畅的翻译。然而非机器翻译模型受到词汇外问题和罕见词问题的影响,导致翻译质量下降。 字符分割是机器翻译中为了避免词层翻译的缺点而采用的一种技术。字符分割的主要优点是它可以对任何字符组成进行建模,从而能够更好地对罕见的形态变体进行建模。

    23331

    学界 | 对比神经机器翻译和统计机器翻译:NMT的六大挑战

    Translation)」,并希望读者能看到神经机器翻译的不足和未来的发展方向。 该论文论述的神经机器翻译(NMT)六大挑战:领域误匹配、训练数据的总量、生僻词、长句子、词对齐和束搜索(beam search)。 5 个不同的德语-英语 统计机器翻译(SMT)和 神经机器翻译(NMT)系统使用了不同的语料库单独训练,即 OPUS 中的法律、医疗、IT、可兰经、字幕,然后再在所有 OPUS 语料库中训练一个新系统。 总结 最后虽然神经机器翻译有这些困难,当我们不能否认的是它十分高效。并且神经机器翻译仍然已经克服了大量的挑战,最显著的是 NMT 在领域外和低资源条件下的翻译十分出色。 ? 我们同样展示了基于短语统计机器翻译质量的不足和改进之处。 ?

    1.2K80

    神经机器翻译与代码(下)

    complete code here #https://github.com/umer7/nmt 参考文件: 《机器翻译的统计方法 概述:基于实例的机器翻译,1999。 使用RNN编码器-解码器学习语法表示,用于统计机器翻译,2014年。 联合学习对齐和翻译的神经机器翻译,2014。 谷歌的神经机器翻译系统:弥合人类和机器翻译之间的差距,2016。 神经网络的序列到序列学习,2014。 循环连续翻译模型,2013年。 基于各国的统计机器翻译的连续空间翻译模型,2013年。

    34620

    IARPA启动“机器翻译(MATERIAL)”计划

    国家情报总监办公室内的情报高级研究项目活动今天宣布了一项多年的研究努力,开发一种语言处理软件,称为“机器翻译”,用于英文检索各种语文的信息,使用户能够迅速开发和部署完全自动化的系统,使只有英语的人能够准确和有效地识别感兴趣的外国媒体新闻文件 Intelligence)内的情报高级研究项目活动(Intelligence Advanced Research Projects Activity)宣布启动一项多年研究项目,开发名为“英文检索任何语言信息的机器翻译 ‘英文检索任何语言信息的机器翻译’项目旨在研究如何最高效地开发整合现有的语言处理技术,应对多语言语音和文本数据提出的具体信息需要。” 通过竞争性广泛机构公告书(Broad Agency Announcement)情报高级研究项目活动将“英文检索任何语言信息的机器翻译”研究合同给了美国约翰·霍普金斯大学( Johns Hopkins University

    87590

    机器翻译新时代:Facebook 开源无监督机器翻译模型和大规模训练语料

    【导读】基于深度学习的机器翻译往往需要数量非常庞大的平行语料,这一前提使得当前最先进的技术无法被有效地用于那些平行语料比较匮乏的语言之间。 为了解决这一问题,Facebook提出了一种不需要任何平行语料的机器翻译模型。该模型的基本思想是, 通过将来自不同语言的句子映射到同一个隐空间下来进行句子翻译。 J{\'e}gou, Herv{\'e}}, journal={arXiv preprint arXiv:1710.04087}, year={2017}} MUSE是仅用单语数据[2]的无监督机器翻译工作的开山之作 使用单语数据的无监督机器翻译 [2] G. Lample, L. Denoyer, MA.

    1.8K110

    如何用PaddlePaddle实现机器翻译

    机器翻译(machine translation, MT)是用计算机来实现不同语言之间翻译的技术。 机器翻译即实现从源语言到目标语言转换的过程,是自然语言处理的重要研究领域之一。 本文将带领大家了解经典的端到端神经网络机器翻译Seq2Seq模型,以及如何用PaddlePaddle来训练。 在统计机器翻译技术中,转化规则是由机器自动从大规模的语料中学习得到的,而非我们人主动提供规则。 将深度学习应用于机器翻译任务的方法大致分为两类:1)仍以统计机器翻译系统为框架,只是利用神经网络来改进其中的关键模块,如语言模型、调序模型等(见图1的左半部分);2)不再以统计机器翻译系统为框架,而是直接用神经网络将源语言映射到目标语言 作为经典模型的实现,可以帮助大家更好的理解机器翻译。 ?

    55920

    神经机器翻译与代码(上)

    目录 机器翻译 统计机器翻译 神经机器翻译 编码器 解码器 注意机制 训练 为翻译德语短语英译的Keras完整代码 机器翻译 机器翻译是将一种语言的源文本自动转换成另一种语言的文本的任务。 这使得自动机器翻译的挑战变得困难,也许是人工智能中最困难的挑战之一: 事实是,准确的翻译需要背景知识,以解决歧义和建立句子的内容。 经典的机器翻译方法通常涉及将源语言中的文本转换为目标语言的规则。 统计机器翻译 统计机器翻译(Statistical machine translation,简称SMT)是使用统计模型,学习将文本从源语言翻译成目标语言,给出大量实例的语料库。 神经机器翻译 神经机器翻译,简称NMT,是利用神经网络模型来学习机器翻译的统计模型。 ——谷歌的神经机器翻译系统:弥补人与机器翻译之间的鸿沟,2016 ? 编码器 编码器的任务是提供输入语句的表示形式。输入句子是一个单词序列,我们首先参考嵌入矩阵。

    48310

    扫码关注腾讯云开发者

    领取腾讯云代金券