深度学习用的有一年多了,最近开始 NLP 自然处理方面的研发。刚好趁着这个机会写一系列 NLP 机器翻译深度学习实战课程。
---- 新智元报道 编辑:QQ 【新智元导读】 10月30日,字节跳动技术社区ByteTech将主办对外技术沙龙,大咖分享,圆桌论坛,等你围观参与! 字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书,等等,产品和服务覆盖全球150个国家和地区。截至2021年6月,抖音日活跃用户数已经突破6亿,字节跳动旗下全线产品总MAU(月活跃用户)超过19亿。 一款全球化的产品,该如何冲破语言阻碍?将产品信息快速传达给不同语言背景的用户,提升产品价值?这是产品全球化过程中需要解决的
CCF-腾讯犀牛鸟基金由腾讯与中国计算机学会联合发起,旨在通过搭建产学合作平台,连接产业实践问题与学术科研问题,支持海内外优秀青年学者开展与产业结合的前沿科研工作。 2018年CCF-腾讯犀牛鸟基金共涵盖机器学习、计算机视觉及模式识别、语音技术、自然语言处理、大数据技术、区块链等6个重点技术领域,涉及31项研究命题。 上一期,我们介绍了机器学习、计算机视觉与模式识别两个申报主题,这期我们将介绍语音技术专题和自然语言处理技术专题。欢迎青年学者关注了解,希望大家可以从中找到适合自己的申报命题。 三、语音技
CCF-腾讯犀牛鸟基金由腾讯与中国计算机学会联合发起,旨在通过搭建产学合作平台,连接产业实践问题与学术科研问题,支持海内外优秀青年学者开展与产业结合的前沿科研工作。 2018年CCF-腾讯犀牛鸟基金共涵盖机器学习、计算机视觉及模式识别、语音技术、自然语言处理、大数据技术、区块链等6个重点技术领域,涉及31项研究命题。 上一期,我们介绍了机器学习、计算机视觉与模式识别两个申报主题,这期我们将介绍语音技术专题和自然语言处理技术专题。欢迎青年学者关注了解,希望大家可以从中找到适合自己的申报命题。 三、语音技术专
我们为什么叫「递归」 “递归” (recursion) 是一种在程序设计语言中被广泛使用的算法。它有两大特点,一是调用自己,二是化繁为简。我们当中那些优秀的技术人又何尝不是如此?他们以身作则,用实际行动影响身边的人,规范了流程、提高了效能,使整个团队从中得益。这就是我们「递归」栏目的初心,记录平凡腾讯技术人的不平凡。 语言的存在使人类可以集思广益、通力协作,最终达成目标。而语言差异不仅带来沟通障碍,甚至会影响地域的发展。在腾讯有这么一个技术团队,他们专注于少数民族语言与汉语的互译研究,致力于解决
ChatGPT是一款基于人工智能的语言模型,它可以自动地生成文本,回答问题,完成翻译等任务。ChatGPT是由OpenAI公司开发的,使用了神经网络和深度学习技术。它可以帮助用户自动生成文本,以及模拟人类语言表达的思维模式。
机器之心原创 作者:邱陆陆 机器翻译领域正经历又一次骤雨疾风般的变革。2014 年,Yoshua Bengio 组做出了第一个循环网络编码器-解码器神经机器翻译模型。而后仅 3 个月,基于 LSTM 结构和注意力机制的神经机器翻译系统就达到了可以与统计机器翻译(SMT)媲美的水平。到了 2016 年,谷歌翻译正式将神经机器翻译用于八个英语与其他语言的语言对,让深度学习多了一个影响每个人的接口。 今年,网易有道上线了自主研发的 YNMT,让以中文为中心的、根据中文用户使用习惯定制的神经翻译系统服务于 6 亿有
2011年,TA还只会“中-英”翻译这一项技能。但TA却用十年时间,在翻译这条路上不断打磨自己。
神经机器翻译(NMT)关注的是通过 AI 在不同人类语言之间进行翻译的过程。2015 年,蒙特利尔学习算法研究所的研究人员开发出了一项新的算法模型,最终让机器给出了对应的翻译。一夜之间,像谷歌翻译这样的翻译软件质量得到了大幅度提升。
学计算机的人通常有着比较系统的思维方式,按编程模式来看,即分为定义,分解,以及优化迭代的思路来解决问题。学语言的,极少数上过逻辑课,没有经过推理训练,一般偏向于模糊感性的思维方式。 机器翻译,则是理科
精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。学生通过“十分精英圈”线上平台,随时获取前沿技术资讯、沉淀科研收获与心得;通过“智学研讨会”及“智享交流会”等线下平台,积极参与海内外顶级学术会议及学术专家交流活动;通过“精英研学营”进阶平台,对话产业
近年来,深度学习方法极大的推动了自然语言处理领域的发展。几乎在所有的 NLP 任务上我们都能看到深度学习技术的应用,并且在很多的任务上,深度学习方法的表现大大超过了传统方法。可以说,深度学习方法给 NLP 带来了一场重要的变革。
唯物按:作者陈村,剑桥大学自然语言处理(NLP)组, 现为机器学习语义分析工程师。 Google Translate 作为久负盛名的机器翻译产品,推出 10 年以来,支持 103 种语言,一直是业界的
鉴于数据、计算力、算法等诸多门槛,自神经机器翻译(NMT)产品化以来,在很大程度上便是互联网巨头们的竞技场。 如今,又一个新的挑战者高调加入进来,直接把矛头指向堪称行业技术标杆的谷歌、微软以及 Facebook。 上周,来自德国的 DeepL 翻译上线,号称实现了 NMT 技术的新突破,打造出了“世界上最精确、语言组织最自然的机器翻译系统”;并宣布在自家组织的盲测中,打败了谷歌翻译以及微软与 Facebook 的 NMT 系统,衅意十足。 目前,DeepL 翻译已支持英德法西等 42 门欧洲语言,正在对
机器之心原创 作者:高静宜 3 月 29 日,「语音智能与人机交互联合实验室」在北京成立,该实验室由中国人工智能公司出门问问与中科院自动化研究所模式识别国家重点实验室自然语言处理与机器翻译研究团队联合建立,将专注于自然语言理解、多轮对话管理、问答系统、机器翻译等人机语音交互核心技术研发领域。出门问问成立于 2012 年 10 月,是一家在语音识别、语义分析、垂直探索等技术领域具备自主研发能力的人工智能公司。根据此前路透社报道,于 2015 年 11 月出门问问完成 C 轮融资后的累计融资金额达 7500 万
于恒:直播间的朋友大家好!欢迎大家来到本次AI科技大本营公开课,我是本次讲师于恒。
在科学研究中,从方法论上来讲,都应先见森林,再见树木。当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“综述”专栏,敬请关注。
上一周,清华大学AMiner发布了《2018自然语言处理研究报告》(下载地址:https://pan.baidu.com/s/1IXuZLgGVHjfYyyX63jcVHQ),因为时间原因,没能及时的更新,希望大家见谅。现在作者以初学者的态度整理了一下该报告的主要内容,希望能帮助大家。
机器之心专栏 作者:钱利华 本文提出了一种为单步并行生成进行词之间依赖关系建模的方法。基于该方法的模型GLAT在不久前的国际机器翻译大赛(WMT2021)上击败一众自回归翻译系统,夺得了德语到英语方向机器翻译自动评估第一。 目前机器翻译中常用的神经网络模型(例如 Transformer ,LSTM)基本上都是自回归模型(Autoregressive models)。自回归模型在输出句子时是逐词按顺序生成的,每一个输出的词都依赖于之前的输出词。 虽然自回归模型被广泛应用并取得了不错的效果,但是自回归模型要求
NLP技术持续发展,各种预训练模型层出不穷,NLP结合产业应用在各行各业中形成爆发态势。本次会议聚焦NLP领域最新的技术以及产业应用场景。2月23日,欢迎报名参加。 为工程师提供顶级交流平台 CCF TF第94期 主题 NLP技术和产业化进展 2023年2月23日 19:00-21:00 长按识别或扫码报名 报名链接:https://conf.ccf.org.cn/TF94 从算法模型,到产业应用,NLP在各个子领域都在进行突破,也面临更多的挑战和机遇。随着NLP模型越来越大,参数量迅速膨胀,分布式训练
Attention机制是最近深度学习的一个趋势。在一次采访中,OpenAI的研究总监Ilya Sutskever说Attention机制是最令人兴奋的进步之一,而且已经广为使用。听起来激动人心吧。但attention机制究竟是什么呢? 神经网络里的Attention机制是(非常)松散地基于人类的视觉注意机制。人类的视觉注意机制已经被充分地研究过了,而且提出了多个不同的模型,所有的模型归根结底都是按照“高分辨率”聚焦在图片的某个特定区域并以“低分辨率”感知图像的周边区域的模式,然后不断地调整聚焦点。 Atte
---- CS224d-Day 9: GRUs and LSTMs -- for machine translation 视频链接 课件链接 ---- 本文结构: 机器翻译系统整体的认识 什么是 parallel corpora 三个模块 各模块有什么难点 RNN 模型 最简单的 RNN 模型 扩展模型 GRU: LSTM ---- 下面是video的笔记: 1.机器翻译 机器翻译是NLP问题中比较难的其中之一,为了解决这个问题,有一些很好玩的模型: Gated Recurrent U
选自Amazon 机器之心编译 参与:机器之心编辑部 随着神经机器翻译(NMT)技术的不断演进,越来越多的科研机构和公司选择开源自己的项目,让更多人能够开发出自己的 NMT 模型。此前,清华大学开源了神经机器翻译工具包 THUMT,谷歌也推出了基于 TensorFlow 的 NMT 模型搭建教程。作为 MXNet 的支持者,亚马逊也开源了自己的 NMT 框架 Sockeye。在本文中,亚马逊宣称这个基于 MXNet 的工具可以用于构建目前业内表现最佳的神经机器翻译模型。 Sockeye GitHub 链接:
12月11日,2021年腾讯犀牛鸟精英科研人才培养计划正式对外发布。计划截止申报时间为2021年1月28日24:00。 本年度精英科研人才计划将延续人工智能领域顶尖科研人才培养,发布包含机器人、AI医疗、量子计算、智慧城市等12个前沿热议方向,71项研究课题。入选学生将由校企导师联合制定专属培养计划,并获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。 本期小编整理了该计
👆点击“博文视点Broadview”,获取更多书讯 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标语言(Target Language)。 图 1 通过计算机将一句汉语自动翻译为英语 一直以来,文字的翻译往往是由人完成的。 时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计
你真的了解NLP吗?本文主要是对当前自然语言处理领域的主要研究内容进行了梳理,共包含五个部分:NLP概述、NLP相关技术分类、NLP研究人员分布、NLP的应用、NLP的发展趋势。该篇文章能够帮助刚刚入坑NLP的小伙伴尽快找到自己的定位,同时也能协助已经在坑中挣扎多年的小伙伴看清该领域的全貌。
在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。
10月27日晚7点,机器之心最新一期线上分享邀请到东北大学教授、博士生导师肖桐带来分享,系统梳理机器翻译发展的技术脉络,并介绍机器翻译发展历程中的经典工作。直播过程中将送出20本肖桐和朱靖波教授的联合著作《机器翻译:基础与模型》。详情见文末。 广义上讲,“翻译”是指把一个事物转化为另一个事物的过程。 在人类语言的翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻译”。 如图1所示,可以通过计算机将一句汉语自动翻译为英语,汉语被称为源语言(Source Language),英语被称为目标
NVIDIA 创始人兼 CEO 黄仁勋先生关于计算领域之未来的主题演讲。 演讲人:黄仁勋 NVIDIA 创始人兼 CEO 2018/11/21 周三 10:00 - 12:00 | 主会场 三层金鸡湖厅
机器翻译(Machine Translation,MT)是一种自然语言处理技术,旨在将一种语言的文本自动翻译成另一种语言。机器翻译是自然语言处理领域的重要应用之一,它可以帮助人们在跨语言交流、文档翻译和信息检索等方面更加便捷和高效。本文将详细介绍自然语言处理的机器翻译。
由于人类语言的流动性, 自动翻译或者机器翻译可能是最具挑战性的人工智能任务之一.20世纪90年代, 统计方法被用于完成这项任务, 取代了此前传统上的基于语法规则的翻译系统. 最近, 深度神经网络模型在命名为神经机器翻译的领域中获得了最先进的成果.
作者:科大讯飞cobbyli、zmwang 摘自:36氪 (36kr.com) 不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助Skype软件的实时翻译功能竟然实现了无障碍交
👆点击“博文视点Broadview”,获取更多书讯 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经7
作为自然语言处理中一项非常重要的应用,现代意义上的机器翻译概念从上世纪40年代提出至今,经过了几代革新,现已初步实现了多场景的落地和应用。而近几年随着机器翻译质量的提高,机器翻译将代替人工翻译的声势逐渐浩大起来,那么机器翻译对于人工翻译而言是威胁还是可利用工具?在多大程度上机器翻译又能帮助普通用户呢?
说到腾讯的翻译大家都不陌生,QQ和微信聊天平台上的翻译,QQ浏览器上的翻译全页等功能都是由腾讯云的机器翻译提供强大支持的,但腾讯云的机器翻译到底是啥?它和百度,有道那些翻译APP有啥不同?我相信有这些疑惑的不止我一个人。所以,今天我要和大家分享的就是我初次接触使用腾讯云机器翻译的一些认识,希望本文章能给想要了解腾讯云机器翻译的伙伴们提供一些小小的帮助。
在人工智能发展进程中艾伦·麦席森·图灵,这位著名英国数学家、逻辑学家,最早提出了机器人是否会思考的概念,图灵也被誉为现代计算机科学之父和人工智能之父! 艾伦·麦席森·图灵(1912年6月23日-1954年6月7日),被誉为“人工智能之父” 我们把时间推回到半个多世纪的某个夏天,此时麦卡锡、明斯基等众科学家们正在举办一场Party,在这次聚会上探讨和共同研究了用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出! 如今人工智能商业化正在快速推进中,比如我们所知道和了解的人像识别、图像识别技术
11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - “腾讯辅助翻译”(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量。该产品采用业内领先的人机交互式机器翻译技术,融合神经网络机器翻译、统计机器翻译、输入法、语义理解、数据挖掘等多项前沿技术,配合亿级双语平行数据,为用户提供实时智能翻译辅助,帮助用户更好更快地完成翻译任务。产品旨在致敬人工翻译,辅助人工翻译更快、更好地完成任务,探索人工智能赋能翻译行业新思路。
朱靖波博士是小牛翻译创始人、东北大学计算机学院教授、博士生导师、辽宁省语言智能技术创新中心主任、讯飞AI大学首批特聘教授、中国中文信息学会常务理事。曾入选教育部新世纪优秀人才计划和辽宁省百人层次人才计划。1992年开始从事语言分析和机器翻译理论研究工作,发表了200多篇研究论文和一本清华大学出版的专著《自然语言理解》。
本文探讨了机器翻译的十个问题,包括什么是机器翻译,机器翻译的发展历程,机器翻译的技术难题,机器翻译的评价标准,实验室和实用系统的区别,基于规则与基于统计的机器翻译,机器翻译的伦理问题,以及译员是否需要学习CAT等。作者认为,机器翻译的评价标准需要重新审视,不能仅仅依靠BLEU得分,而应该结合具体应用场景和目标来进行评估。同时,译员应该积极学习并掌握CAT技术,提高自己的翻译效率和质量。
摘要 机器翻译伴随着世界上第一台计算机的诞生而出现,随后成为人工智能领域最具挑战性的研究课题之一。70 多年来,以机器翻译、人机对话系统、文本自动分类、自动文摘和信息抽取等为代表性应用的人类语言技术所走过的曲折发展历程,从不同的侧面折射出人工智能领域的荣禄兴衰。本文在简要回顾人类语言技术发展历程的基础上,重点介绍当前该技术面临的主要挑战和研究现状,并对未来发展的趋势进行展望。 关键词
想一下未来50年或者100年,您的孙子或者孙子的孙子,是否还会花费人生中十几年甚至几十年的时间学习一门外语,甚至还学不好?
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 1 历经70载,机器翻译进入 深度学习驱动时代 机器翻译诞生于
自然语言处理(NLP)领域的机器翻译是一项备受关注的任务,它致力于使用计算机自动将一种语言的文本翻译成另一种语言。这一领域涉及到深度学习、神经网络和大规模语料库的应用,为我们提供了强大的跨语言沟通工具。本文将深入研究机器翻译的原理、常见的技术方法,并提供一个基于Transformer模型的简单实例。
表示 n 元词组这一项的 BLEU 得分,为了使用一个数值来评价一个机器翻译系统,需要将
机器翻译作为自然语言处理中最典型的应用,翻译“神器”不断面世,可以说在AI应用领域正当红。那么,机器翻译经历了怎样的开端、泡沫、被判死刑?又怎样冲破藩篱、摒弃语言学,借助神经网络而走红?
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用?
【新智元导读】一家名叫DeepL的公司声称他们的翻译工具已经超过谷歌、微软、Facebook等大公司的翻译工具,本文提供了作者亲测的评价。 谷歌、微软、Facebook等科技巨头都将机器学习应用于翻译,但是一家名叫DeepL的小公司已经超越它们。DeepL开发的翻译工具与谷歌等的竞争产品一样快,但其准确度和对翻译内容的微妙把握比我们尝试过的任何翻译工具都更好。 我除了英文,只会讲一些法语,但幸运的是,我的同事Frederic会讲很多国家的语言。我们都认为DeepL的翻译总体上优于谷歌翻译和Bing翻译。 我
机器之心报道 机器之心编辑部 在 WAIC 2021 AI 开发者论坛上,阿里巴巴副总裁、达摩院语言技术实验室负责人司罗发表了主题演讲《大规模语言智能为商业搭建桥梁》。在演讲中,他主要介绍了阿里巴巴如何搭建自己的自然语言技术体系,以及阿里巴巴深度语言模型体系 AliceMind 及相应的技术和应用场景。 以下为司罗在 WAIC 2021 AI 开发者论坛上的演讲内容,机器之心进行了不改变原意的编辑、整理: 我是来自阿里巴巴的司罗。在 2014 年加入阿里之前,我在普渡大学担任老师,所以非常有幸在十几年时间
领取专属 10元无门槛券
手把手带您无忧上云