梦晨 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 听说微软搞了个AI翻译文言文? 赶紧来试试,先来一段《曹刿论战》的开头: 我震惊了,居然能把“我”翻译成“鲁国”,“公”翻译成“鲁庄公”。 难道AI除了学习文言文词汇和语法,还熟读了《左传》? 换成诗表现又将如何? 虽然翻译出来不是很有文学性,但AI正确理解到了“望着同一个月亮”这层意思。 嚯,这个翻译极大地引起了我的兴趣。 如果百度和微软一起上考场 既然翻译出正确词意不是太难,那文言文中的特殊语法AI能否掌握? 为了更好地评估微软翻译的
第三代翻译API让用户输入字词对照表,自定义特殊字词翻译,并且还能使用多模型进行批次翻译
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。 第 1 期:RNNsearch、Multi-task、attention-mode
近年来随着深度学习和神经网络技术的发展,机器翻译也取得了长足的进步。神经网络结构越来越复杂,但我们始终无法解释内部发生了什么,“黑箱问题”一直困扰着我们。我们不清楚程序在翻译过程中如何进行决策,所以当翻译出错时也很难改正。随着深度学习在各行各业中的广泛应用,深度学习的不可解释性已经成为其面临的严峻挑战之一。
以及各大书本上写的“将计算机语言翻译成计算机能识别的语言”,栏主这几个星期消失的时间段里,从编译原理基础开始,到理解正则,文法,优化,错误处理等各个方面为各位理清,编译究竟做了什么,我们的终极目标是成功编译方舟编译器,从零开始。
AI 科技评论按:语言翻译是一股能够让人们组建群体和使世界更加紧密的力量。 它可以帮助人们与在海外居住的家庭成员联系起来,或者可以更好地了解讲不同语言的人们的观点。 通过使用机器翻译,自动翻译文章和评
A. Vaswani等人的《Attention Is All You Need》被认为是解决了众所周知的LSTM/RNN体系结构在深度学习空间中的局限性的突破之一。本文介绍了transformers 在seq2seq任务中的应用。该论文巧妙地利用了 D.Bahdanau 等人通过联合学习对齐和翻译的神经机器翻译注意机制的使用。并且提供一些示例明确且详尽地解释了注意力机制的数学和应用。
我们都知道而且喜欢谷歌翻译(Google Translate),这个网站可以几乎实时地在 100 多种不同的人类语言之间互相翻译,就好像是一种魔法。 谷歌翻译背后的技术被称为机器翻译(Machine
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。 第 1 期:RNNsearch、Multi-task、attention-model
近日,有道发布了一项全新的翻译服务——人机翻译,通过自研的神经网络翻译技术(YNMT),让翻译的价格创了新低。 早在2011年,有道就推出了专业的人工翻译服务,这项服务由具有翻译资格的译员提供高质量的翻译结果。 而比起纯粹的人工翻译,此次发布的有道人机翻译最大的不同之处在于它把有道神经网络翻译(Youdao Neural Machine Translation,YNMT)和专业人工翻译结合在了一起,处理翻译需求时,首先由YNMT进行初步翻译,在机器翻译结果的基础上,由专业译员对初译结果进行编辑润色,大幅度提
每天给你送来NLP技术干货! ---- 来自:AI有温度 大家好,我是泰哥。本篇文章从什么是命名实体讲到为什么要做命名实体,然后讲到了NER数据处理及建模经验,对于做NER的同学,不论你是新手还是老手都非常值得一看! 1 什么是NER 1.1 什么是实体 根据百度百科定义,实体是指客观存在、并可相互区别的事物。实体可以是具体的人、事、物,也可以是概念。 1.2 什么是命名实体 命名实体就是以名称为标识的实体。简单来说,若我们听到一个名字,就能知道这个东西是哪一个具体的事物,那么这个事物就是命名实体。比如我有
Transformer 是为解决序列转换或问题而设计的架构,该任务将一个输入序列转化为一个输出序列。 语音识别、文本转语音等问题都属于这类任务。
每天给你送来NLP技术干货! ---- 编辑:AI算法小喵 写在前面 之前我们曾分享过几篇 NER 的相关论文,大家应该还有点印象。这次小喵看到一篇比较系统的 NER 相关文章,特别适合小白。作者从什么是命名实体讲到为什么要做命名实体,然后讲到了 NER 数据处理、建模的经验,内容非常丰富,所以这次打算跟大家分享一下。 1. 什么是NER 1.1 什么是实体 根据百度百科定义,实体[1]是指客观存在、并可相互区别的事物。实体可以是具体的人、事、物,也可以是概念。 1.2 什么是命名实体 命名实体 就是以名称
机器翻译是一项具有挑战性的任务,包含一些使用高度复杂的语言知识开发的大型统计模型。 神经机器翻译的工作原理是——利用深层神经网络来解决机器翻译问题。 在本教程中,你将了解如何开发一个神经机器翻译系统,
一年前,网友在 reddit 上提问道,生成式对抗网络 GAN 是否可以应用到自然语言处理上。GAN 理论的提出者,OpenAI 的科学家,深度学习理论奠基人之一 Yoshua Bengio 的得意门生 Ian Goodfellow 博士回答了这个问题:
在1990年初,在IBM研究中心,一个机器翻译系统首次被展示,它对规则和语言学一无所知。它用两种语言分析了下图中的文本,并试图理解这些模式。
场景描述:机器翻译是自然语言处理领域的一个重要应用,从它最初的诞生到现在,已经过去了 60 多年,但在一些小问题上,还是会出现令人啼笑皆非的情况。机器翻译是如何一步步发展来的?它背后的的机理是什么样子?它的局限性又是怎么一回事呢?
在这个例子中输入数据是10个中文汉字,输出为6个英文单词, 和 数量不一致,这就需要用到序列到序列的RNN模型。
我们在看文献的时候经常会看到非常地道的表达,我们把它们抄在一个个小本本上,当我们自己写文章的时候,这些句子就想用到我们的文章中,但是直接抄是不行的,需要改写句式,填写我们想要表达的内容。
来源:Science 编译:Bing 📷 得益于神经网络的发展,机器自动翻译已取得了很大的进步。但是训练这样的网络需要有大量的数据,要向计算机展示数以百万个人类翻译的例子。现在,有两篇新的论文表明,神经网络可以无需平行文本自学翻译。这个令人惊讶的进步能让多语言的文档更容易访问。有趣的是,这两篇论文提交的时间只相差一天。 论文一:Unsupervised Neural Machine Translation:https://arxiv.org/abs/1710.11041 论文二:Unsupervised M
选自Vas3k.com 作者:Ilya Pestov 英语版译者:Vasily Zubarev 中文版译者:Panda 实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求了。近日,Ilya Pestov 用俄语写的机器翻译介绍文章经 Vasily Zubarev 翻译后发表到了 Vas3k.com 上。机器之心又经授权将其转译成了汉语。希望有一天,机器自己就能
原文标题:Releasing PAWS and PAWS-X: Two New Datasets to Improve Natural Language Understanding Models
近日,谷歌发布了包含 7 种语言释义对的全新数据集,即:PAWS 与 PAWS-X。BERT 通过该数据集的训练,在释义对问题上的精度实现了约为 3 倍的提升;其它先进的模型也能够利用该数据集将精度提高到 85-90%。谷歌希望这些数据集将有助于推动多语言模型的进一步发展,并发布了相关文章介绍了该数据集,我们将其整理编译如下。
由于人工智能的飞速发展,机器翻译水平正在大幅提升,并逐渐赶超人类,这已经是不争的事实。然而,同在机器翻译这个赛道里的各位“赛手”,谷歌、有道等传统翻译产品或公司,也正在上演着一场激烈的角逐和比拼。 人工智能翻译大赛 谷歌竟然连败两场? 12月的一个早上,北京798软件园,一场机器翻译的pk赛正在进行。活动主办方品玩,是一家“有品好玩”的科技媒体。 这场人工智能翻译大赛的规则是三局两胜,第一局考验对话翻译,第二局考验识别能力,第三局是挑战图像翻译。 而三款同台竞技的翻译软件则是:Google翻译、有道翻译官和
人类传递信息的载体是语言,不同语言之间的交流靠的是翻译,比如世卫组织在疫情防控中,在官网上发布了一个公告,号召大家勤洗手以预防感染。
我们已经分三期关于CVPR 2018(计算机视觉和模式识别)会议:第一部分专门讨论计算机视觉的GAN,第二部分涉及关于识别人类(姿势估计和跟踪)的论文,第三部分涉及合成数据。 今天,我们深入探讨最近一直在兴起的深度学习领域的细节:领域适应。 对于这个NeuroNugget,我很高兴为您呈现我的共同作者Anastasia Gaydashenko,他已离开Neuromation并继续加入思科...但他的研究继续存在,这就是其中之一。
本文介绍了神经网络翻译技术的基本原理、发展历程和主要应用。通过神经网络模型对大量语料进行训练,可以实现对句子进行分词、转换和翻译。目前,神经网络翻译技术已经广泛应用于各种场景,例如旅游、科技、新闻等领域。尽管神经网络翻译技术取得了显著的进展,但仍然存在一些问题,如领域适应、语料库建设和翻译质量等。
本文介绍了神经网络翻译和传统机器翻译的区别,以及目前机器翻译在领域适应、语料库、断句和语序等方面的技术革新。尽管机器翻译已经取得了很大的进步,但在某些情况下仍无法完全替代人类翻译,未来机器翻译的发展仍需与人类翻译者共同提高。
不管你在世界的哪个地方,美国、巴西、法国或者亚洲的婆罗洲岛,借助机器翻译,谷歌和Facebook这类软件都可以把平台上的几乎任何文字内容都翻译成当地语言。
注意力(Attention)机制,是神经机器翻译模型中非常重要的一环,直接影响了翻译的准确度与否。
Encoder-Decoder 通常称作 编码器-解码器,是深度学习中常见的模型框架,很多常见的应用都是利用编码-解码框架设计的,如:
基于深度学习的神经网络机器翻译已经在通用翻译、领域翻译、翻译评估和自动译后编辑等多个场景,产生了巨大的商业价值,但是仍然存在着两个典型问题。一方面,过译漏译等质量问题仍然存在;另一方面,端到端的神经网络黑盒架构使专家介入优化比较困难,传统离散知识不能很好融入模型算法。 在 2021 年 11 月 25 日和 26 日,AICon 全球人工智能与机器学习大会(北京)上,我们邀请到了华为文本机器翻译实验室主任杨浩,他将从离散知识和神经网络模型的融合角度为你带来《知识驱动的机器翻译研究和实践》,希望可以为你带来启发。
词意消歧 在词意消歧中,我们要算出特定上下文中的词被赋予的是哪个意思。 思考存在歧义的词 serve 和 dish: (1) a. serve: help with food or drink; hold an office; put ball into play b. dish: plate; course of a meal; communications device 在包含短语 he served the dish 的句子中,你可以知道 serve 和 dish 都用的是它们与食 物相关的含义。在短
大数据文摘出品 作者:蒋宝尚、Andy 这两天,微信翻译团队难得的上了次热搜。 事情的发展是这样的。有网友发现,当翻译中带有caixukun的人名拼音时,微信翻译会出现一些奇怪的中文词语,比如 之后,不仅人名测试开始一发不可收拾,网友们纷纷出动,想要寻找微信翻译的其他彩蛋网友们因此大为惊奇,玩得不亦乐乎,以至于这个话题被推上了热搜。 针对相关问题,腾讯微信团队昨天也做出了回应,强调这不是暖心的彩蛋,是翻译引擎在翻译一些没有进行过训练的非正式英文词汇时出现误翻。 文摘菌今天早上进行测试,发现微信团队已经修复
因为客观条件的诸多限制,影视字幕的内容通常与原文存在不小的偏差,故有学者认为影视翻译的本质不是翻译,而是改编。影视字幕的翻译中既有常规的翻译规范,也有很多现象和技巧是一般笔译工作中没有的。影视字幕对原文做的三种调整,是删、改、添。
编译:弗格森 【新智元导读】 两篇新的论文表明,神经网络可以在不需要平行文本的情况下学习翻译,这是一个令人惊讶的进步,它将可以让人们可以读懂更多语言的文档。 因为神经网络,即一种以人脑为启发的计算机算法,自动的语言翻译取得了长足的进步。但是训练这样的网络需要大量的数据:通过数以百万计逐句对应的翻译来展示人类是如何做到这一点的。现在,两篇新的论文表明,神经网络可以在不需要平行文本的情况下学习翻译,这是一个令人惊讶的进步,它将可以让人们可以读懂更多语言的文档。 “想象一下,你给一个人很多中文书籍和大量的阿拉伯语
最近在研究AIGC,先是玩了一下Midjourney,后来Midjourney免费额度用完了,也不再开放免费额度给新用户使用了,于是转而研究Stable Diffusion。
机器翻译,作为自然语言处理的一个核心领域,一直都是研究者们关注的焦点。其目标是实现计算机自动将一种语言翻译成另一种语言,而不需要人类的参与。
随着全球化进程的加速和国际交流的不断增加,人们对于跨语言沟通的需求也在不断增加。如果机器能够快速准确地将一种语言翻译成另一种语言,则将大大提高沟通效率,促进文化交流,推动经济发展,有助于加强不同国家和地区之间的友好往来。
今天我们来讲解释器模式【Interpreter Pattern】,如何理解这一个模式呢?一个简单的例子、中英文翻译器这个东西的作用是啥呢?将不知道的英文翻译成中文以便于理解、或者把中文翻译成英文来使用。其中目的也就是将语言进行翻译解释方便去理解使用。那么解释器模式呢?也有相似的逻辑、该模式实现了一个表达式接口、该接口解释一个特定的上下文。主要对于一些固定文法构建一个解释句子的解释器。
循环神经网络(五) ——Bean搜索、bleu评分与注意力模型 (原创内容,转载请注明来源,谢谢) 一、概述 本文主要讲解机器翻译过程中涉及的算法,主要包括bean搜索算法及其改进与误差分析、bleu
【新智元导读】Future of Life 网站采访了 Richard Mallah 和 Ian Goodfellow,讨论 AI 在过去一年取得的进步,以及对2017年的展望。 2016年,AI 取得了一些重要的发展。我们采访了 Richard Mallah 和 Ian Goodfellow,和他们一起聊一聊 AI 在过去一年所取得的进步。Richard 是 FLI(Future of Life Institute) AI 项目的主管,他是多家AI 公司的资深顾问,创建了获得最高评价的企业文本分析平台。I
摘要: 本文讲的是用深度学习解决自然语言处理中的7大问题,文本分类、语言建模、机器翻译等,自然语言处理领域正在从统计学方法转向神经网络方法。在自然语言中,仍然存在许多具有挑战性的问题。但是,深度学习方
《圣经》中记载,人类曾经联合起来兴建能通往天堂的高塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。
当把中文翻译成法文时,以前最好的多语种模型的方式是把中文翻译成英文,把英文翻译成法文,因为英语的训练数据是最多的。
“666”是一种网络用语,大概是表示某人很厉害、我们很佩服的意思。最近又衍生出另一个数字“9”,意思是“6翻了”,实在太厉害的意思。如果你以为这就是厉害的最高境界,那就错啦 —— 目前的最高境界是数字“27”,因为这是 3 个 “9”!
机器学习中体现着各种工程和科学上的哲学思想,大的有集成学习,没有免费午餐,奥卡姆剃刀;小的有最大化类间差异、最小化类内差异。对于很多问题,存在着一类通行的解决思路,其中的一个典型代表就是“编码器-解码器”结构。这一看似简单的结构,背后蕴含的工程思想却非常值得我们学习和品味。
随着时代的不断发展,国际化的潮流也越来越明显,不管是在工作中还是在我们日常的学习中,外语使用的次数也是越来越多的,特别是在工作中,当你拿到一份英文的PPT我想对于很多人都是一脸懵逼的,看又看不懂,一句句翻译想想这工作量,就会感觉自己身体快要被掏空了,那么英文PPT怎么翻译成中文?今天呢就来给大家分享两个简单的方法教你轻松搞定,想知道是哪个简单的方法吗?一起来看看吧。
ChatGPT 相关话题最近非常火热,很多人尤其是程序员群体已经开始使用 ChatGPT 或 New Bing 辅助自己解决工作中的问题,甚至开始用他们来写代码了。 但现在使用 ChatGPT 有一点不便的地方,一方面官网免费版经常超时,而且官网暂时不支持机器人,有些任务执行前需要交代相关背景和要求,写的太简略则效果不好,写的太复杂每次粘贴不方便。
领取专属 10元无门槛券
手把手带您无忧上云