前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法

日本机器翻译第一人长尾真逝世!首个提出基于实例的机器翻译方法

作者头像
AI科技评论
发布2021-07-02 15:24:13
7450
发布2021-07-02 15:24:13
举报
文章被收录于专栏:AI科技评论AI科技评论

整理 | 陈彩娴

编辑 | 刘冰一

AI科技评论消息:5月23日,日本知名自然语言处理学者长尾真(Makoto Nagao)教授因不小心摔了一跤,在日本家中去世,享年85岁。

长尾真教授是日本机器翻译研究的第一人、国际自然语言处理研究的先驱,在促进中日交流方面做出了巨大贡献,先生千古!

据维基百科介绍,长尾真教授在1936年10月出身于日本三重县,本硕博均就读于京都大学电机系(分别毕业于1959年、1961年与1966年)。随后,1967年,他加入京都大学担任助理教授,1968年升为副教授,1973年成为教授,1997年成为京都大学第23位校长、并任职至2003年。

2003年从京都大学退休后,长尾真被日本国立信息通信技术研究所聘为所长,任职至2007年,之后又加入日本国会图书馆担任馆长,任职至2012年。

他的研究课题广泛,涉足机器翻译、自然语言处理、模式识别、图像处理与图书馆科学等多个研究方向,对NLP的贡献主要集中在3个方面:1)机器翻译;2)语言处理技术;3)数字图书馆。

凭借出色的研究成果,长尾真在1993年被授予IEEE Emanuel R. Piore奖、1997年获得国际机器翻译协会荣誉勋章、2003年获得ACL终身成就奖等等荣誉。他也是亚太机器翻译协会(AAMT)第一任主席。

长尾真教授在NLP上影响最深远的,是其上世纪80年代早期首次提出基于实例的机器翻译方法,开拓了机器翻译研究的新方向。

1984年,他发表了《采用类比原则进行日-英机器翻译的一个框架》("A framework of a mechanical translation between Japanese and English by analogy principle")一文,探讨日本人初学英语时翻译句子的基本过程。

长尾真认为,初学英语的日本人总是记住一些最基本的英语句子以及一些相对应的日语句子,他们要对比不同的英语句子和相对应的日语句子,并由此推论出句子的结构。参照这个学习过程,在机器翻译中,如果我们给出一些英语句子的实例以及相对应的日语句子,机器翻译系统来识别和比较这些实例及其译文的相似之处和相差之处,从而挑选出正确的译文。

长尾真指出,人类并不通过做深层的语言学分析来进行翻译,人类的翻译过程是:首先把输入的句子正确地分解为一些短语碎片,接着把这些短语碎片翻译成其它语言的短语碎片,最后再把这些短语碎片构成完整的句子,每个短语碎片的翻译是通过类比的原则来实现的。因此,我们应该在计算机中存储一些实例,并建立由给定的句子找寻类似例句的机制,这是一种由实例引导推理的机器翻译方法,也就是基于实例的机器翻译方法。

在基于实例的机器翻译系统中,系统的主要知识源是双语对照的翻译实例库,实例库主要有两个字段,一个字段保存源语言句子,另一个字段保存与之对应的译文,每输入一个源语言的句子时,系统把这个句子同实例库中的源语言句子字段进行比较,找出与这个句子最为相似的句子,并模拟与这个句子相对应的译文,最后输出译文。

基于实例的机器翻译系统中,翻译知识以实例和义类词典的形式来表示,易于增加或删除,系统的维护简单易行,如果利用了较大的翻译实例库并进行精确的对比,有可能产生高质量译文,而且避免了基于规则的那些传统的机器翻译方法必须进行深层语言学分析的难点,在翻译策略上是很有吸引力的。

此外,1982年至1986年,长尾真在Mu机器翻译项目上发挥了重要作用。这是一个基于迁移模型的翻译系统,用于翻译自然科学领域的技术论文摘要,是世界上第一个成功实现日语与英语互翻的机器翻译系统。要知道,日语与英语的语法结构完全不同,机器翻译的实现难度可想而知。

长尾真教授致力于日语语言技术与方法的创新。上世纪90年代初,他开发了名为“JUAMN”的日语词法分析工具。日语的拼写无法百分百标记单字边界,词法沾着,而JUAMN是第一个能够与日语分割与词法分析结合在一起的工具包。他的工作能够同时进行日语单字分割、词法分析与POS标记。JUAMN的准确率达到95%,鼓励了许多基于相同原理的系统开发,有些系统甚至达到98%的准确度。

除了JUAMN,1994年,长尾真教授与Sadao Kurohashi(现任日本京都大学教授)开发了一种基于依赖项的语法解析器,名为“KNP”,特别适合日语之类的单字自由语言。

在数字图书馆方面,长尾真教授参与贡献开发的Adriadne系统对日本乃至全世界数字图书馆的研究与开发产生了深远影响。在数字图书馆研究中,他提升文档内容之间与内容内部的索引方面用到了NLP技术。

同时,在模式识别与图像处理上,他也是第一位将反馈分析机制应用于人脸识别系统的研究员,并推动了人工智能技术在图像处理中的应用。

参考链接:

  1. http://blog.sina.com.cn/s/blog_72d083c70100nyxv.html
  2. https://web.archive.org/web/20100612214728/http://aclweb.org/index.php?option=com_content&task=view&id=36&Itemid=30
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档