微软宣布在中英文机器翻译方面取得重大突破

AiTechYun

编辑:nanan

微软本周三宣布,他们已经创造出了第一台机器翻译系统,能够以与人一样的准确度将新闻稿件从中文翻译成英文。该公司表示,他们对该系统进行了反复的测试,从各种网络报纸上收集了大约2000句话,并将结果与个人翻译过程进行比较,甚至还聘请了双语的语言顾问来进一步验证这台机器的准确性。

这个名为newstest2017的样本集是去年秋天在WMT17的研究会议上发布的。

那么,令人惊讶的是,研究人员能够多快实现这一里程碑——尤其是考虑到机器翻译是人们几十年来一直试图解决的问题。

微软指出,许多人甚至认为人类平等的目标永远不会实现。

在微软的博客中,负责微软语音、自然语言和机器翻译工作的技术人员黄学东表示:“在机器翻译任务中,实现人类的平等是我们所有人都梦寐以求的。我们只是没想到我们能这么快就击中它。”

在这种程度上让机器理解语言要比语音识别复杂得多——这是近年来出现的一些进步。人工智能和语音识别技术的进步使得语音助手能够在我们的智能手机和家庭中找到方法,帮助消费者处理日常的计算任务,控制智能家居设备,以及新闻和娱乐的目的。

但是,要求对网页或新闻文章进行机器翻译仍常常会出现同样难以理解的单词混乱,充其量只能让你大致了解所讲的内容,但几乎不可能深层次的理解。

要真正理解文章中所说的内容,你需要一个人的帮助。

但即使是不同的人工翻译,也可以用一种稍微不同的方式翻译一个句子。

“机器翻译比单纯的模式识别任务复杂得多,”微软亚洲研究院副总裁兼自然语言处理组负责人周明表示,“人们可以用不同的词语来表达完全一样的东西,但你不能说哪一个更好。”

微软也注意到,最近在人工智能领域的突破有助于研究人员实现这一里程碑。

深度神经网络是一种训练人工智能系统的方法,使研究人员能够创造出更流畅、更自然的翻译,将更广泛的背景考虑进来,即所谓的统计机器翻译。

微软的研究人员还将他们自己的训练方法添加到系统中,以提高其准确性——这些方法等同于人们如何利用自己的工作时间,并确保它是正确的。

研究人员表示,他们使用的方法包括:双重学习的事实检查翻译; 审议网络,重复翻译和改进; 以及联合培训等新技术,以迭代方式促进英汉翻译系统和中英文翻译系统; 和协议正规化,可以通过从左到右和从右到左阅读句子来生成翻译。

周明说道,实现这一里程碑的技术不会局限于机器翻译。

“这是一个机器翻译研究可以应用到人工智能研究领域的领域,”周明表示。

此外,它可以在将来使用其他语言实现更准确和自然的翻译。

研究人员警告说,该系统还没有在实时新闻报道上进行测试,而且在这项技术被商业化到微软的产品之前还有其他的挑战。

但是你可以尝试新的翻译系统在微软的网站:https://translator.microsoft.com/neural(该网站警告称,有时可能运行得较慢)。

该系统将以中文(简体)显示一个句子,然后翻译成两种方式,并以更完善的翻译来证明其改进。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-03-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

谷歌收购Kaggle平台案背后精明的人工智能策略

上月初,谷歌宣布其正收购科学数据平台kaggle。其中,kaggle平台的许多评论家以及新闻报道者也以吸收人才的方式一并被收购。与此同时,kaggle平台目前也...

33740
来自专栏SDNLAB

云计算行业高收入的11个技能

随着企业将基础设施迁移到公有云中,对掌握了云计算技能的专业人员的需求逐渐加大,企业无法找到足够的专业人员来管理和支持其环境,云计算技能逐渐成为所有IT技能中最受...

54360
来自专栏无原型不设计

五个步骤搞定敏捷UX设计

互联网产品发展的速度越来越快,人们对于产品的要求也在不断的升级,这直接地导致了用户体验设计的重要性不断提升。与此同时,过去的流程冗长的设计开发模式已经不能够满...

28530
来自专栏灯塔大数据

大数据入门的四个必备常识

一、大数据分析的五个基本方面 1、可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为...

376110
来自专栏XIEJUN

未来十种AI人工智能技术

AI人工智能说(或写)出正确的单词并且是连贯的顺序来传达一个明确且清晰的意思,而且还能很容易被听众(或读者)理解,对于一台以完全不同于人脑的方式处理信息的AI人...

14500
来自专栏CDA数据分析师

一个母婴电子商务网站的大数据平台及机器学习实践

母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的...

22260
来自专栏西安软件开发

弈聪软件卓建超:大数据可视化分析技术决定大数据商业驱动力

传统企业在数字化转型中,大数据分析技术对数据有效的展示能够极大提高对信息的洞察力。目前虽然已有大量的大数据可视化工具可供使用且很多大数据企业也正在使用这些工具,...

16160
来自专栏互联网数据官iCDO

人工智能如何帮助我们理解社交媒体

翻译 互联网数据官(iCDO)志愿者 齐云涧 ? 如果你是X战警漫画系列的粉丝,你熟悉Cerebro,一个虚构的设备,可以进入人类的脑波,并有能力通过个人的想法...

44850
来自专栏华章科技

大数据入门,你需要懂这四个常识

大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常...

9530
来自专栏大数据文摘

思必驰俞凯:自然语言技术的畅想关键点不在交互,而是自然丨清华人工智能研习社

11220

扫码关注云+社区

领取腾讯云代金券