首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

论机器翻译之浅薄

众所周知,旧版 Google 翻译可以处理很多种语言,但深度学习版新 Google 翻译最初只支持 9 种语言(译注:目前是 96 种)。于是,把探讨语种限定在四种:英语法语、德语和中文。...到最后,Google 翻译彻底误解了这句话所要表达意思。 为了传达原句本来意图,只好亲自这些短句翻译成法语: Chez eux, ils ont tout en double....表达清楚后,让 Google 翻译将我法语准确译回英语以为是水到渠成事了。但我又一次想多了,它错得更是离谱: At home, they have everything in double....只有当我脑中构建场景足够丰富时,才会试着用另一种语言将它们表达出来——“将它们提取出来”。在翻译时,试着以我认为自然方式用语言 B 表达脑中场景,这些场景构建就是原文含义。...一整段或几个句子可能翻得相当不错,但这可能让人错误地认为 Google 翻译知道自己在做什么,知道什么是“阅读”。在这种情况中,Google 翻译似乎真的表现得很好——几乎像人一样!

1K60

自然语言处理深度学习7个应用

文本分类 语言建模 语音识别 字幕生成 机器翻译 文档摘要 问答(Q&A) 试图专注于你可能感兴趣各种类型终端用户问题,而不是更多学术或语言子问题,在有些方面深度学习已经做很好,如词性标注,...一种神经概率语言模型,2003 语音识别 语音识别是理解说了什么问题。 …语音识别的任务是包含自然语言话语语音映射成说话人想要表达对应词。...考虑到深度神经网络使用,该领域被称为神经机器翻译。 在一个机器翻译任务中,输入由一些语言一系列符号组成,计算机程序必须把它转换成另一种语言符号序列。...包含一些例子: 一个文本文件从法语翻译成英语西班牙音频翻译成德语文本。 英语文本翻译成意大利音频。 更多关于神经机器翻译,请参见: 维基百科上神经机器翻译。...下面是机器翻译深度学习3个例子: 从英语法语文本翻译。 基于神经网络片段到片段学习,2014 从英语法语文本翻译。 联合学习对齐和翻译神经机器翻译,2014 从英语法语文本翻译。

1.2K90
您找到你想要的搜索结果了吗?
是的
没有找到

无需依赖英语中介,FB发布可翻译100种语言AI模型

大数据文摘出品 来源:engadget 编译:Fisher、Miggy 机器翻译器成为现代人生活中必不可少工具。...不管你在世界哪个地方,美国、巴西、法国或者亚洲婆罗洲岛,借助机器翻译,谷歌和Facebook这类软件都可以把平台上几乎任何文字内容都翻译成当地语言。...不过你可能不知道是,多数翻译系统都是英语作为中间语言进行翻译工作。也就是说,在把中文翻译成法语时其实是中文到英语再到法语。...“主要挑战在于,我们如何利用我们翻译系统,切实地去满足全世界各地人们需求,”Facebook AI助理研究员Angela Fan在采访中表示。“你翻译所有的语言,涉及人们会遇到各种需求。...“传统上,人们使用人类译员来创建翻译数据,”她继续说道,“这很难大规模来做,比如,你很难找到同时讲英语和泰米尔语的人,同时讲法语和泰米尔语就更难了,非英语翻译仍旧是一个有待加强领域。”

98231

百度新突破:AI同声传译系统STACL,可预测,低延迟

以下是百度解释方式: 在例子Bùshí Zǒngtǒng zài Mòsīkē(布什总统在莫斯科)和英译“President Bush”中,ķ=2,2个词落后于中文,我们系统准确地预测,下一个翻译单词必须是...STACL另一个关键优势是延迟灵活性。它可以设置更低或更高,取决于两种语言相关程度,例如,法语和西班牙语较低,英语和中文等远程语言较高,或英语和德语等不同单词顺序语言较高。...“翻译质量更常见是低延迟要求,但与传统全句(例如非同步)翻译相比,我们系统在质量上只有很小损失,”百度写道,“考虑到低延迟要求,我们继续提高翻译质量。”...STACL推进了该公司早期语音识别工作,更广泛地说,是AI相关工作。...微软在3月展示了一个系统,该系统在新闻从中文翻译成英文时与人类表现相匹配。Facebook已经开始利用无监督机器学习内容从一种语言翻译成另一种语言

1.1K00

技术教育兴起

但是,20年过去了,渐渐发现,英语学习没有以前那么重要了。 一方面,国内机会和收入越来越多,不比国外少。更重要是,技术快速发展,使得语言壁垒越来越低,甚至消失。...当地官方语言是阿拉伯语,上层人士说法语,底层民众说柏柏语,就会一点英语,大多数时候都无法进行语言交流。但是居然没遇到一点困难,顺利地把这个非洲国家玩了一圈,还在撒哈拉沙漠住了两个晚上。...5、 随着外语培训重要性下降,认为,培训重头转为技术培训。以前大家排队去上外语补习班,将来会排队去上技术补习班。 原因就是技术变得比语言更重要。...知道许多技术人都通过比特币发了财,而这只是技术带来财富浪潮之中一个突出案例。如果你了解技术,你就会看到有这样机会。现在看上去,只有技术才能提供这样从底层快速上升机会。...一种悲观预感。未来只有两种途径可以改变人生,一种是学习技术,另一种是购买彩票。

76670

人工智能能否在翻译中胜过人类?

现在,只需点击几下,我们就能理解以任何语言编写任何内容。好消息是这种人工智能翻译解决方案在准确性方面不断学习和发展。...此外,它还提高了我们检测欺诈能力,扩大了我们视野,并帮助我们在一个充满复杂语言世界中导航。 由于快速高效的人工智能,人类翻译工作是否处于危险之中?...长期以来,文本和短语从一种语言翻译成另一种语言一直是人类口译员面临挑战。人类需要阅读和理解演讲或文件预期含义,然后这种理解转化为他们自己语言。这样,观众才能理解。...今天,最先进的人工智能语言翻译系统可以在最常见语言之间准确翻译——比如英语法语。 然而,这一切都归结为说话语气和风格。人工智能可能无法理解每种不同语言中都有大量俚语、短语和习语。...因此,它可能会将这些词翻译成它们字面意思,从而从根本上改变句子意思。 AI 在翻译领域未来是什么? 机器翻译是人工智能一个领域,它处理文本从一种语言自动翻译成另一种语言

90830

多么痛领悟——计算机组成原理第一讲

主板是整个计算机“交通枢纽”,各种器件都要连接到主板上,才能正常工作。 ? 中央处理器是计算机“大脑”,它是计算机运算核心和控制核心。 ?...由于“软件”发展不仅可以充分发挥机器“硬件”功能,提高机器工作效率,而且已经发展到能局部模拟人类思维活动,因此在整个计算机系统内,“软件”地位和作用已经成为评价计算机系统性能好坏重要标志。...”系统等都属于操作系统,想看到这你应该明白了不少吧,要是还没明白,就再多看几遍,看图理解也行,至少你现在要明白没有安装软件计算机就是一堆废铜烂铁,应用程序必须再操作系统支持下才能运行。...,像汉语、英语法语、俄语等都是世界上主流语言。...,等等吧,这是瞎说,主要体会精神,这就代表你把无序0101状态给规则化了,研发一种语言必须定义规则,就像研发英语要定义主谓宾语法一样道理,那现在我们把0101组合成不同序列定义相应规则,这样有了这些规则后告诉你

60740

Nature:英语称霸科研还要多久?英语能力和科研能力不应混为一谈

由于这个机会,在2000年到2002年之间,在蒙彼利埃国家科学研究中心(CNRS)实验室工作了12个月。在那里,必须同时学习两种语言工作英语和日常生活中法语。无法沟通是令人沮丧。...因为必须要和别人主动交流,他们不会自己来找我交流,因为我们说不是同一种语言在中学就学过英语,但水平不高,而在西班牙没有英语电视节目。大学里绝对没有针对英语水平培训。...在18世纪到19世纪时,欧洲科学家经常需要学习法语、德语和拉丁语,只有这样才能跟上所在研究领域新动向。现在科学家负担大大减轻了,只需要掌握英语一种语言,这带来了很多好处,但同时也缺乏公平性。...如果现在全世界都认为泰语或印地语应该是科学语言,我们会有很多工作要做,首先是要创建一套完整术语体系。 人们常常问我,是否有一天英语会被其他语言取代。 对此表示怀疑。英语其实是一种反常现象。...以前从未有出现过一种全球性语言认为以后也不会再出现另一种。在未来,甚至可能在本世纪内,科学上使用语言可能有三种:英语、汉语和另一种语言,比如西班牙语,葡萄牙语或阿拉伯语。

1.2K30

用机器学习解码一颗“失声”15年大脑,让它“开口说话”

另一种方法是一些合作者在 2021 年一篇论文中首创,它让一个用户想象他拿着笔在纸上写信,在运动皮层中产生信号,这些信号被翻译成文本。...决定研究语言潜在神经生物学,如果可能的话,开发一种脑机接口 (BMI) 来恢复失去语言的人交流。...除了神经外科背景外,团队还拥有语言学、电气工程、计算机科学、生物工程和医学方面的专业知识。 肌肉如何帮你说话 语言是使 人类与众不同能力之一。...起初,我们有很多关于神经代码问题。一种可能性是神经活动编码了特定肌肉方向,大脑本质上就像按下键盘上键一样打开和关闭这些肌肉,并且通过另一种模式决定肌肉收缩速度。...首先,解码器将来自大脑信号翻译成声道肌肉预期运动,然后这些预期运动翻译成合成语音或文本。

26020

【Science】无监督式机器翻译,不需要人类干预和平行文本

“想象一下,你给一个人很多中文书籍和大量阿拉伯语书籍,这些书之间没有重叠,但这个人必须学会把中文翻译成阿拉伯语。这似乎是不可能,对吧?”...如果只是在两种常见语言,比如英语法语翻译中使用这一技术,效果还是不错,因为许多文档都以这两种语言存在。但是,对于罕见语言或者那些虽然常见,但是缺乏平行语料库语言来说,它运行就不是很好。...在反向翻译中,先把一种语言句子大致翻译成另一种语言,然后再翻译回原来语言。如果翻译后句子与最初句子不一致,则调整神经网络再次翻译,直到变得越来越接近。...去噪与反向翻译类似,但不是从一种语言另一种语言然后再回来,而是从一种语言(通过重新排列或删除单词)中添加噪声,并尝试将其翻译回最开始语言。这些方法组合,能够教给网络更深层次语言结构。...在一个语言解码为另一种语言之前,这两个系统都将其从一种语言编码为更抽象表示,但Facebook系统研究员认为,其系统“中间语言”是真正抽象

65590

Transformer:隐藏机器翻译高手,效果赶超经典 LSTM!

序列到序列(Seq2Seq)是一种神经网络,它将给定元素序列(例如句子中单词序列)转换为另一个序列。 Seq2Seq 模型很适用于翻译,它可以一种语言单词序列转换为另一种语言单词序列。...输出序列可以是另一种语言、符号、输入副本等。 我们可以编码器和解码器理解为只会两种语言的人工翻译者。...他们第一语言是母语,但两者母语是不同,比如一个是德语,另一个是法语;而他们第二语言则是他们共有的一种虚构语言。...为了德语翻译成法语,编码器德语句子转换为它所掌握另一种语言,我们在这里称为「虚构语言」。同时,由于解码器能够读取该虚构语言,因此它现在可以把这个语言翻译成法语。...于是,这个模型(由编码器和解码器组成)就可以合力德语翻译成法语。 假设一开始,编码器或解码器对于虚构语言都不是非常流利,为了很好掌握它,我们将使用很多例子对它们(模型)进行训练。

85530

干货 | 揭开多语言词嵌入模型神秘面纱

一种语言都需要单独分类器吗? 不了吧 AI 科技评论按:如今 Facebook 有超过一半用户使用英语以外语言,使用了超过 100 种语言。...可以采取另一种方法是收集大量英语数据来训练一个英语分类器,然后如果有需要对其他语言进行分类,如土耳其语文本,则将土耳其语文本翻译成英语,再用英语分类器进行分类。 但是,这个方法有一些缺点。...首先,翻译过程中错误会传递到分类过程,导致性能下降。其次,对于需分类每一条非英语内容,必须额外调用翻译服务。这种方法显著增加了分类延迟,因为通常翻译比分类耗时更长。 但是这些解决方案都不够好。...然后,使用字典每个嵌入空间投影到一个公共空间(英语)中。字典是由相似的数据自动产生,即数据集是由不同语言,但是相同含义句子组成,通过它来训练翻译系统。 使用一个矩阵嵌入投影到公共空间中。...多语言词嵌入模型对于英语,德语,法语和西班牙语以及联系更紧密语言有更好表现。随着不断扩大应用范围,Facebook 致力于尝试适用于没有大量数据语言新技术。

64840

牛!谷歌向量空间法:图片译成文字

大数据文摘翻译作品 翻译:阚玺(Cathy Xi Kan) 校正:孙强 如需转载,后台留言申请授权 概述:谷歌工程师利用和语言翻译类似的技术开发出了一个用于翻译图片主题机器学习算法 一种语言自动翻译成另一种语言一直以来都是难以攻克问题...例如,在所有语言中,向量“国王-男人+女人=皇后”都应该是一个真命题。 这就使得语言翻译成为了向量空间学里一个问题。...谷歌翻译是通过这一方式实现这一过程:先把句子转换成向量,然后使用这个向量产生意思相同,另一种语言句子。 现在Oriol Vinyals 和他在谷歌合作者们正在使用类似的方法图片转化为文字。...这个向量可以和谷歌现有的翻译算法结合起来去生成英语标题,或者任何其他语言标题。事实上,谷歌机器学习方法已经可以图片转换为单词。...并且,即使在没有网络连接时候也能使用。遗憾是,目前支持翻译文字有限,仅包括英语法语、俄语、德语、意大利语、葡萄牙语和西班牙语,不过未来会支持更多语言

1.3K80

从冷战到深度学习:一篇图文并茂机器翻译史

苏联科学家 Peter Troyanskii 向苏联科学院提交了《用于在一种语言翻译成另一种语言时选择和打印词机器》。这项发明非常简单——它有四种语言的卡片、一台打字机和一台旧式胶片相机。...这正是笛卡尔所梦想那种中间语言一种语言,遵循普适规则并且可以翻译变成一种简单「来回切换」任务。接下来,中间语言可以转换成任何目标语言,而这就是奇点!...曾经试过使用句法树来解决比单纯地解析主语和谓语更复杂任务。但我每次都放弃了,然后使用了另一种方法。 如果你成功过至少一次,请让知道。...这是网络自己幻想,而我们觉得这很美。 ? 如果我们可以迁移照片风格,那我们能不能将另一种语言施加到源文本上呢?...只发现了一个原型设计试图开发出能让知晓一种语言网络能通过阅读另一种语言文本来获取经验:https://arxiv.org/abs/1710.04087。倒是想自己试试看,但我很笨。

96960

语言多模态、多任务检索模型 MURAL 解读

作者 | Aashi Jain、Yinfei Yang 译者 | Sambodhi 策划 | 凌敏 通常,从一种语言另一种语言没有直接一对一翻译。...在英语中,人们通常会联想到穿着白裙新娘和穿着燕尾服新郎,但是翻译成印地语(शादी)时,更恰当联想可能是穿着鲜艳色彩新娘和穿着高领长外套(印度男装 Sherwani)新郎。...已有的研究已经在高资源语言(如英语)学习图像 - 文本联合表示方面取得了很大进展。这些表示模型努力图像和文本编码为共享嵌入空间向量,使得图像和描述它文本在这个空间中相互接近。...这项技术允许用户通过图像来表达那些不能直接翻译成目标语言词语。例如,“valiha”一词是指马尔加什人所演奏一种管状乐器,在大多数语言中不会有直接翻译,但是可以通过图像轻松地描述出来。...除了资源丰富语言外,我们还在最近发布维基百科图像文本(Wikipedia Image–Text,WIT)数据集上对 MURAL 进行了评估,该数据集涵盖了 108 种语言,包括资源丰富(英语法语

1.2K30

迈克尔 · 乔丹:讨厌机器学习称为AI

因为没有语义信息,甚至都没法开始自然语言处理。 翻译并不是输进去一种语言字符串,然后得到另一种你之前已经见过很多次语言字符串就可以了。...法语很流畅,你用英语和我交流,也能理解你说话意思,我会将你话里概念转换成法语词汇,而不是英语字符串映射为正确法语字符串。...他通过英语法语、德语和中文四种语言翻译比对论证得出一个结果:谷歌翻译即使应用了人工智能技术也没有真正理解语言语言真的是人类智慧,包含了对这个世界各种事物讽刺、隐喻、引用和参考。...在做所有工作都是在证明收敛率和随机性定理,你要是看过主页就会知道这些天有多兴奋,但我形成这些观点却是基于在公司(实践)经历而不是通过证明它们。...他了解很多音乐人,Steve 经历以及他音乐背景,让他刚好处于一个可以音乐、技术和人联系在一起位置。认为我们社区可以参与这种活动是非常令人激动,而 Steve 就刚好给出了这把钥匙。

39230

Python和R之间转换基本指南:使用Python或R知识来有效学习另一种方法简单方法

这里介绍方法与我们自学习外语时候使用方法是有共同之处,例如我们要学习英语,可以使用以下三个关键练习帮助我从笨拙地中文单词翻译成英语,转变为直接用英语思考和回答(英语思维)。...重复这个词很多次,并在许多不同场景中使用它,把这个词深深地刻在脑海里。 利用上下文线索使能够更好地理解这个词在同义词上用法和原因。 ?...“)要求您了解print函数工作原理、编辑器如何返回print语句以及何时使用引号。当你学习第二种编程语言时,你可以将你所知道语言概念翻译成语言,从而更有效、更快地学习。...数据科学世界被Python拥护者和R狂热者分割开来。但是,任何学习过其中一种语言的人,都应该充分利用它们优势,深入到另一种语言中去,而不是宣称自己是一方。...虽然大多数数据科学家倾向于使用一种语言另一种语言,但是在这两种语言中都能很好地使用最适合您需要工具。

1.1K40

为什么机器学习部署起来这么难?

这是我们正在处理一些问题: 管理数据科学语言 你可能知道,机器学习应用程序通常由使用不同编程语言编写组成。它们之间相互作用并不是很好。...多次看到,机器学习pipeline从R开始,在Python中继续,并以另一种语言结束。...对于原型设计来说,它是一种很棒语言,因为它允许简单交互和解决问题,但是需要将它翻译成Python或c++或Java来进行生产。...建议你使用一种工具或平台,它可以立即将代码从一种语言转换为另一种语言,或者允许你数据科学团队在API背后部署模型,以便在任何地方集成它们。...更多挑战 在做项目的过程中,也注意到了以下问题: 如果我们改变了一个输入特征,那么其余特征重要性、权重或使用可能也会改变。机器系统必须设计易于跟踪特征工程和选择更改。

39820

为什么机器学习部署起来这么难?

这是我们正在处理一些问题: 管理数据科学语言 你可能知道,机器学习应用程序通常由使用不同编程语言编写组成。它们之间相互作用并不是很好。...多次看到,机器学习pipeline从R开始,在Python中继续,并以另一种语言结束。...对于原型设计来说,它是一种很棒语言,因为它允许简单交互和解决问题,但是需要将它翻译成Python或c++或Java来进行生产。...建议你使用一种工具或平台,它可以立即将代码从一种语言转换为另一种语言,或者允许你数据科学团队在API背后部署模型,以便在任何地方集成它们。...更多挑战 在做项目的过程中,也注意到了以下问题: 如果我们改变了一个输入特征,那么其余特征重要性、权重或使用可能也会改变。机器系统必须设计易于跟踪特征工程和选择更改。

92630

为什么机器学习部署起来这么难?

这是我们正在处理一些问题: 管理数据科学语言 你可能知道,机器学习应用程序通常由使用不同编程语言编写组成。它们之间相互作用并不是很好。...多次看到,机器学习pipeline从R开始,在Python中继续,并以另一种语言结束。...对于原型设计来说,它是一种很棒语言,因为它允许简单交互和解决问题,但是需要将它翻译成Python或c++或Java来进行生产。...建议你使用一种工具或平台,它可以立即将代码从一种语言转换为另一种语言,或者允许你数据科学团队在API背后部署模型,以便在任何地方集成它们。...更多挑战 在做项目的过程中,也注意到了以下问题: 如果我们改变了一个输入特征,那么其余特征重要性、权重或使用可能也会改变。机器系统必须设计易于跟踪特征工程和选择更改。

59110
领券