麻省理工学院一位经济学家撰写的新研究表明,改进后的翻译软件可以显著促进在线国际贸易——这是机器学习对经济活动产生明显影响的一个显著案例。研究发现,eBay在2014年改进了自动翻译程序后,可以使用这一新系统的两个国家的贸易额猛增了10.9%。
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
在 8月7日在德国柏林召开的2016 计算语言学(ACL)大会上,学者Thang Luong、Kyunghyun Cho 和 Christopher D. Manning进行了关于神经机器翻译(NMT)的讲座。神经机器翻译是一种简单的新架构,可以让机器学会翻译。该方法虽然相对较新,已经显示出了非常好的效果,在各种语言对上都实现了最顶尖的表现。神经网络在自然语言处理方面,未来有巨大的应用潜力。 讲座学者之一 Kyunghyn Cho 与深度学习“大神” Yoshua Bengio、蒙特利尔大学学者 Jun
【新智元导读】微软昨天宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。 由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队今天宣布,其研发的机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。 微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东博士表示,这是自然语言处理领域的一项里程碑式的成就。“这是我们的情怀,是非常有意义的工作,”黄学东告诉新智元:“消除语言障
选自 einstein.ai 机器之心编译 参与:Nurhachu Null、蒋思源 自然语言处理(NLP)这个领域目前并没有找到合适的初始化方法,它不能像计算机视觉那样可以使用预训练模型获得图像的基本信息,我们在自然语言处理领域更常用的还是随机初始化词向量。本文希望通过 MT-LSTM 先学习一个词向量,该词向量可以表征词汇的基本信息,然后再利用该词向量辅助其它自然语言处理任务以提升性能。本文先描述了如何训练一个带注意力机制的神经机器翻译,其次描述了如何抽取该模型的通用词向量与将其应用于其它任务的性能。
选自arXiv 作者:Antonio Valerio Miceli Barone等 机器之心编译 参与:Nurhachu Null、李泽南 在神经机器翻译问题中,不同的堆叠架构已经多次在不同研究中展现出了良好的表现,而深度转换架构(Deep transition architecture)则成功地用于语言建模等用途中。爱丁堡大学与 Charles University 的研究者们对这两种架构的多个组合形式在 WMT 翻译任务中的表现进行了测试,并提出了结合堆叠与深度转换的新型神经网络:BiDeep RNN。
INTERFACE 分享者:陈伟、李健涛 机器之心报道 参与:李泽南 3 月 12 日,搜狗正式在线上平台发布了「旅行翻译宝」。这款随身翻译设备结合了搜狗神经网络机器翻译、语音识别、图像识别等多项技术,不仅支持语音、图像翻译等多种翻译模式,还提供中英日韩俄德等 18 种语言互译。 在深度学习快速发展的今天,机器翻译系统的能力究竟达到了什么样的水平?机器翻译是否已经可以代替人类翻译?3 月 17 日,机器之心与搜狗共同举办的 INTERFACE 线下分享中,搜狗语音交互技术中心研发总监陈伟、搜狗 IOT 事
【新智元导读】 随着AlphaGo战胜柯洁,AI 所激起的惊慌不仅在围棋界蔓延,而且扩展到了几乎每一个领域,翻译受到的冲击尤为严重。深度学习的出现极大地变革了机器翻译:2013年以来基于神经网络的机器翻译在速度和准确度将翻译水平提升到了新的台阶。当下,科技巨头的激烈争夺以及学术界百花齐放的研究下,机器翻译水平仍在不断地进化当中,超过人类水平只是时间问题。在新的智能时代中,翻译这个“古老”的职业会消失吗? “从事翻译的人很可能会看到一些工作机会在不断消失,他们必须要习惯一种‘创业思维’。” 5月27日,中国围
12月11日,2021年腾讯犀牛鸟精英科研人才培养计划正式对外发布。计划截止申报时间为2021年1月28日24:00。 本年度精英科研人才计划将延续人工智能领域顶尖科研人才培养,发布包含机器人、AI医疗、量子计算、智慧城市等12个前沿热议方向,71项研究课题。入选学生将由校企导师联合制定专属培养计划,并获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。 本期小编整理了该计
机器之心原创 作者:邱陆陆 机器翻译领域正经历又一次骤雨疾风般的变革。2014 年,Yoshua Bengio 组做出了第一个循环网络编码器-解码器神经机器翻译模型。而后仅 3 个月,基于 LSTM 结构和注意力机制的神经机器翻译系统就达到了可以与统计机器翻译(SMT)媲美的水平。到了 2016 年,谷歌翻译正式将神经机器翻译用于八个英语与其他语言的语言对,让深度学习多了一个影响每个人的接口。 今年,网易有道上线了自主研发的 YNMT,让以中文为中心的、根据中文用户使用习惯定制的神经翻译系统服务于 6 亿有
👆点击“博文视点Broadview”,获取更多书讯 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标语言(Target Language)。 图 1 通过计算机将一句汉语自动翻译为英语 一直以来,文字的翻译往往是由人完成的。 时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计
在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。
导语 :一年一度的全国机器翻译大赛(CCMT 2019)于7月20日公布了比赛结果,来自TEG的腾讯民汉翻译团队自去年拿下英汉翻译冠军之后,再一次载誉而归。团队经过多日奋战,最终在30个参赛单位的角逐中脱颖而出,以绝对优势获得三个民族语种中“维吾尔-汉"、“蒙古-汉”任务冠军。而在一个月前国家部委举办的企业级机器翻译系统评测(非受限数据集)中,腾讯民汉翻译团队参加了两个项目,获得了藏语-汉语冠军,维吾尔语-汉语亚军的成绩,这些成绩彰显了腾讯在民族语言技术领域的核心竞争力。 第十五届全国机器翻译大赛(C
自然语言处理果真是人工智能皇冠上的明珠,在走向摘取颗果实的路上,人类恐怕还只是走了一半。
NLP技术持续发展,各种预训练模型层出不穷,NLP结合产业应用在各行各业中形成爆发态势。本次会议聚焦NLP领域最新的技术以及产业应用场景。2月23日,欢迎报名参加。 为工程师提供顶级交流平台 CCF TF第94期 主题 NLP技术和产业化进展 2023年2月23日 19:00-21:00 长按识别或扫码报名 报名链接:https://conf.ccf.org.cn/TF94 从算法模型,到产业应用,NLP在各个子领域都在进行突破,也面临更多的挑战和机遇。随着NLP模型越来越大,参数量迅速膨胀,分布式训练
虽然神经机器翻译模型取得了巨大的性能提升,但是其成功主要依赖于大量的高质量的双语语料。然而,获得大量的高质量的双语语料的成本极高,需要花费大量的人力和物力。在实际应用场景中,有时并没有大量的双语语料可以使用,更加极端情况是没有任何双语语料用来训练翻译模型。因此,想要继续提升神经翻译模型的性能,需要减少模型对高质量双语语料的依赖。对于低资源甚至无资源的翻译场景,我们需要研究能够更加高效使用单语语料的翻译模型和训练方法。
内容提要:今年的「双 11」,似乎比往年来得更早一些。而每年剁手党们狂欢的背后,离不开技术力量的支持。今年,阿里旗下的速卖通就赶在「双 11」之前,推出了多语言实时翻译服务,方便全球的消费者们一起来「剁手」。
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
据《韩国先驱报》报道,早些时候在韩国举办的人机翻译大赛中,美国互联网巨头谷歌研发的人工智能语言软件得分高于同场竞技的其他人工智能机器。 2月21日,由四名专业译者组成的团队与三家人工智能翻译软件进行比
10月27日晚7点,机器之心最新一期线上分享邀请到东北大学教授、博士生导师肖桐带来分享,系统梳理机器翻译发展的技术脉络,并介绍机器翻译发展历程中的经典工作。直播过程中将送出20本肖桐和朱靖波教授的联合著作《机器翻译:基础与模型》。详情见文末。 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标
表示 n 元词组这一项的 BLEU 得分,为了使用一个数值来评价一个机器翻译系统,需要将
当今世界随着大数据、人工智能算法、云计算等技术的发展机器翻译技术又掀起一波新浪潮。伴随着该项技术不断发展的是一场由战争与压迫转为和平与发展的历史,同时这项技术的发展背后亦隐藏着巨大的权力纠纷。
机器之心报道 参与:机器之心编辑部 今日,微软研究团队表示,微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心,他们采用专业人类标注与盲测评分代替 BLEU 分值而具有更高的准确性,且新系统相比于现存的机器翻译系统有非常大的提升。因此,根据人类盲测评分,微软机器翻译取得了至少和专业翻译人员相媲美的效果。 微软亚洲与美国实验室的研究者称,其中英新闻机器翻译系统在常用的新闻报道测试集 newstest 2017 上达到了人类水平。该测试集由来自业界和学界的团队共同开发
国家情报总监办公室内的情报高级研究项目活动今天宣布了一项多年的研究努力,开发一种语言处理软件,称为“机器翻译”,用于英文检索各种语文的信息,使用户能够迅速开发和部署完全自动化的系统,使只有英语的人能够准确和有效地识别感兴趣的外国媒体新闻文件。 美国国家情报总监办公室(Office of the Director of National Intelligence)内的情报高级研究项目活动(Intelligence Advanced Research Projects Activity)宣布启动一项多年研究项目
---- 新智元报道 作者:张乾 【新智元导读】今天,科大讯飞翻译机2.0版本全网开售。新版本增加了摄像头和屏幕,能够对中文与33种国外语言进行即时互译,目前支持国内四川话、广东话、东北话、河南话4种方言,功能强大。胡郁说,讯飞做翻译不是要做一个产品、一项技术或者是一个服务,它是在建立在我们在技术创新,能够改变人类世界坚定信念下的一个长期事业。 下一步,超越专八。 4月20日,科大讯飞执行总裁胡郁在“科大讯飞翻译战略暨新品上市发布会”上宣布,讯飞翻译已经超越中国大学英语6级(CET6)水平。 CET
精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。学生通过“十分精英圈”线上平台,随时获取前沿技术资讯、沉淀科研收获与心得;通过“智学研讨会”及“智享交流会”等线下平台,积极参与海内外顶级学术会议及学术专家交流活动;通过“精英研学营”进阶平台,对话产业
11月,图像分析、人脸识别、自然语言处理NLP推出新功能。腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。
ChatGPT(Chat Generative Pre-trained Transformer),是人工智能技术驱动的自然语言处理工具,即AIGC的一款具体的应用和产品。它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
作者:科大讯飞cobbyli、zmwang 摘自:36氪 (36kr.com) 不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助Skype软件的实时翻译功能竟然实现了无障碍交
2011年,TA还只会“中-英”翻译这一项技能。但TA却用十年时间,在翻译这条路上不断打磨自己。
近年来,机器学习和人工智能迅速出现,为提高商业效率带来了希望。与此同时,研究人员几乎没有发现任何证据支持劳动生产率和经济活动因此取得的进展。
随着全球互联互通日益频繁,几乎人人都渴望着实时翻译这一“逆天”技术能早日变成现实,伴随这一代代科学家们不懈的努力,科幻正一步步照进现实。
---- 新智元报道 编辑:QQ 【新智元导读】 10月30日,字节跳动技术社区ByteTech将主办对外技术沙龙,大咖分享,圆桌论坛,等你围观参与! 字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书,等等,产品和服务覆盖全球150个国家和地区。截至2021年6月,抖音日活跃用户数已经突破6亿,字节跳动旗下全线产品总MAU(月活跃用户)超过19亿。 一款全球化的产品,该如何冲破语言阻碍?将产品信息快速传达给不同语言背景的用户,提升产品价值?这是产品全球化过程中需要解决的
作者 | 李梅 编辑 | 陈彩娴 AI 科技评论获悉,中国机器翻译事业的开创者之一、原中国社科院语言研究所研究员刘倬老师与世长辞,享年 89 岁。沉痛悼念刘倬老师! 刘倬,1933 年 4 月 4 日生于河北省大成县。1949 年从北京市立一中毕业后,他进入华北大学学习,同年11月被分配到哈尔滨外专学习俄语,1951 年毕业后留校任助教。1953 年,他被调入北京高等教育部,在综合大学司任科员。1954 年至 1960 年间,他在北京俄语学院任语言学讲师。 自 1960 年11月起,刘倬加入中国社会科学院
周末来点烧脑的,Salesforce爱因斯坦发布以来究竟做了哪些事情,做了哪些高科技含量的事情,下面我们就来一起看一看Salesforce爱因斯坦在自然语言处理领域的最新研究吧。
来源:环球科学ScientificAmerican 作者:陈宗周 本文长度为5200字,建议阅读5分钟 本文回顾机器翻译发展史,并分析这个曾一度陷入低潮的领域,是如何实现飞跃,并可能在不久的将来打破不同民族间的语言壁垒的。 2017年3月的全国“两会”上,李克强总理来到安徽代表团。讯飞公司董事长刘庆峰拿起桌子上一部手机模样的小设备,说出总理以前对讯飞的勉励——让世界聆听我们的声音,机器马上翻译成流利的英文。他又说“这个哈密瓜很甜”,机器立刻又翻译成流利的维吾尔语。这部叫晓译多语种翻译机的小机器,是讯飞公
【新智元导读】Facebook 今天宣布,从使用基于短语的机器翻译模型改为使用神经网络系统来处理其社交网络后端每天的翻译请求,每天翻译超过 45 亿次。与基于短语的系统相比,BLEU 平均相对提升了 11%。通过使用 Facebook 开源的深度学习框架 Caffe2,基于 RNN 的翻译能够迅速扩展。 Facebook 今天宣布,已经开始使用神经网络系统来处理其社交网络后端每天的翻译请求,总的翻译数量超过 45 亿次。通过使用 Facebook 在今年4月份开源的深度学习框架 Caffe2,基于 RNN
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 18 个在机器翻译任务上曾取得 SOTA 的经典模型。 第 1 期:RNNsearch、Multi-task、attention-model
【新智元导读】 5月10日,Facebook发布了一项新的机器翻译技术,使用CNN技术而非传统的RNN,在翻译准确度超越了此前被认为是2016年10大AI突破技术的谷歌机器翻译,并且翻译速度上快了9倍。Facebook称,在速度上,新的机器翻译系统创下新的世界纪录。 本文带来对基于神经网络的机器翻译(NMT)技术的研究状况介绍和对比。我们看到:这一技术在过去两年中已经成为AI 界的一个热点研究, 学术界对神经机器翻译(NMT)的研究兴趣不减。今年到5月份为止,在开放存取论文网站 arXiv.org 上发表的
到目前为止,虽然机器翻译无法完全做到「信、达、雅」,但翻译结果的准确性对于一般应用场景来说已经足够。
【新智元导读】华为诺亚方舟实验室在他们一篇被 AAAI 2017 录用的论文里提出了一个新的神经机器翻译(NMT)模型,引入基于重构的忠实度指标,结果显示该模型确实有效提高了机器翻译的表现。华为诺亚方舟实验室的研究人员表示,他们的 NMT 技术与谷歌持平。 基于深度学习的机器翻译,简称深度机器翻译近两年来取得了惊人的进展,翻译的准确度综合评比已经超过传统的统计机器翻译,研究单位主要有蒙特利尔大学[1,2],斯坦福大学[3,4],清华大学[5,6],谷歌[3,7,8],微软[9]和百度[5,10],以及华为诺
引言 北京时间6月26日,在刚刚结束的全国机器翻译大赛中(CWMT 2018)中,TEG以“腾讯基础研发部”名义参加比赛(由TEG springhuang 负责, bojiehu、ambyera 组成,jinghaoyan、alanpfhu、zhiqianglv 参与),经过几日通宵的鏖战,从25个参赛单位86个系统中脱颖而出,最终获得英汉翻译第一名,汉英,蒙(蒙古语)汉翻译亚军,维汉翻译第四名,藏汉翻译第七名的好成绩,并在综合总成绩上独占鳌头。 继团队在5月份获得世界机器翻译大赛获得亚军(参见文章《腾讯基
昨天,加州大学旧金山分校的Joseph Makin 等人在 Nature Neuroscience上发表了一篇论文,标题为《利用 encoder-decoder 框架,将大脑皮质活动翻译为文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
“ 精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,定期举办线上线下交流活动,全面提升学生综合素质。入选学生还将获得线上实名社群平台“十分精英圈”的在线访问权限,结识志同道合的科研伙伴,获取业界信息及资源。 ” 今年共有10大方向 81个子课题供大家选择 总有一
雷锋网AI科技评论按:12月21日,由创新工场、搜狗、今日头条三家联合举办的首届 “AI Challenger全球AI挑战赛”在北京举办落幕仪式及颁奖典礼。雷锋网记者也前往了颁奖典礼现场,进行了全程跟踪报道。 都有哪些参赛队伍获奖? 大赛分为视觉和翻译两大类,共五个赛道。分别是人体骨骼关键点检测竞赛、图像中文描述竞赛、场景分类竞赛、英中机器文本翻译竞赛和英中机器同声传译竞赛。参赛队伍共计7079支,其中场景分类参赛团队最多,达2004支。人体骨骼关键点检测参赛团队1735个,图像中文描述1479个参赛队,机
AI 研习社按:12月21日,由创新工场、搜狗、今日头条三家联合举办的首届 “AI Challenger全球AI挑战赛”在北京举办落幕仪式及颁奖典礼。AI 研习社记者也前往了颁奖典礼现场,进行了全程跟踪报道。 都有哪些参赛队伍获奖? 大赛分为视觉和翻译两大类,共五个赛道。分别是人体骨骼关键点检测竞赛、图像中文描述竞赛、场景分类竞赛、英中机器文本翻译竞赛和英中机器同声传译竞赛。参赛队伍共计7079支,其中场景分类参赛团队最多,达2004支。人体骨骼关键点检测参赛团队1735个,图像中文描述1479个参赛
由于人工智能的飞速发展,机器翻译水平正在大幅提升,并逐渐赶超人类,这已经是不争的事实。然而,同在机器翻译这个赛道里的各位“赛手”,谷歌、有道等传统翻译产品或公司,也正在上演着一场激烈的角逐和比拼。 人工智能翻译大赛 谷歌竟然连败两场? 12月的一个早上,北京798软件园,一场机器翻译的pk赛正在进行。活动主办方品玩,是一家“有品好玩”的科技媒体。 这场人工智能翻译大赛的规则是三局两胜,第一局考验对话翻译,第二局考验识别能力,第三局是挑战图像翻译。 而三款同台竞技的翻译软件则是:Google翻译、有道翻译官和
【新智元导读】谷歌今日更新博客,介绍了谷歌神经机器翻译系统重大更新,实现了用单一模型对多语种通用表征。这种新的模型体积不仅与多语言翻译模型一样,参数相同,而且速度更快、质量更高。不仅如此,系统还实现“零数据翻译”,也即能够在从来没有见过的语言之间进行翻译。这意味着传说中的“巴别塔”有望成真。 (文/Mike Schuster,Melvin Johnson,Nikhil Thorat)过去10年中,谷歌翻译已从仅支持几种语言发展到了支持 103 种,每天翻译超过了 1400 亿字。为了实现这一点,我们需要构建
领取专属 10元无门槛券
手把手带您无忧上云