翻译工具的未来发展

随着全球化的日益明显

各语言间的转换需求越来越大

我国翻译行业也随着改革开放

变得火爆起来

翻译本身也随着时代变革

从狭义的文化交流层拓展

到了人们大众的日常生活和交往领域

外国电影字幕便是一个鲜活的例子

本文章以大数据的思想

对翻译工具的未来发展方向进行猜想

如果各位打开搜索引擎并搜索“翻译”二字,众多翻译工具便会依次罗列出来,如百度翻译、有道翻译、谷歌翻译等。对于这些工具,谷歌与有道因准确率更高、品牌效应更好等原因,在国内抢占了大部分用户。小编在大学期间没少借助这些翻译工具来了解文章大意,尤其是在看文献综述时。作为半个资深用户,小编发现目前的翻译工具仍有许多不足(以中英文互译为例),主要体现在以下三个方面:

1、语音输入准确率偏低,导致大部分用户只能选择打字输入。

2、单词的延伸不够,句子延伸更是欠缺。在单词意思以及同义词延伸方面,现阶段的谷歌走在翻译工具前列,其它工具仅有较少延伸,在句子延伸方面,所有翻译工具都是不够的。

3、翻译工具对单个单词翻译较为准确,但随着词组的组合,准确率会逐渐下降,“语无伦次”的翻译结果也已是司空见惯。当然,导致这结果的主要原因为两国的语言文化差异,这无疑也正是翻译过程中的最大障碍。

以上三个方面,完善难度依次递增,第三条的完善难度最大、时耗也最长,但对用户而言,这无疑是最重要的,因为任何一款翻译工具永远离不开两个中心词:准确、高效。

如何解决这些问题呢?大数据与云计算给我们提供了思路,做法如下:

1、做好翻译中的第一步,完善翻译前的本土语言识别与处理程序:因两国存在语言文化差异,语言表达相差甚远,在目前的翻译程序中,本土语言的识别和处理是不够的,以至于程序无法准确的识别出句子的核心主干,剔除可忽略的字词,从而在程序第一步时就已为“语无伦次”结果的出现埋下了祸根,因此在翻译处理之前增加本土语言的识别与处理是必要的。

2、通过大数据手段实现数据库完善的内循环:所有翻译的结果都只是数据库中的数据呈现,一个足够大且足够准确的数据库便是翻译工具的根基。除了开发团队的自我语句构思翻译外,通过大数据收集和分析用户习惯是完善数据库的重要手段之一。

通过收集用户的翻译内容,分析用户的翻译习惯,从而分析出用户所处的行业等重要信息,将这些翻译内容通过公司翻译专员进行准确翻译并更新至数据库中加以完善,循环往复,日积月累,数据库中的数据将越来越多,翻译的准确率也将越来越高。

3、做好翻译中的最后一步,完善译文输出前的识别与处理程序从而实现翻译完善的外循环:此程序主要是为了解决“语无伦次”结果的出现问题,在输出前增加对输出语言的语法、语句结构等的识别,若不满足语言逻辑要求,则执行修改程序,通过不停的修改迭代直至达标方可输出。在处理时间上,大家大可放心,因为计算机的处理速度是超乎想象的,并且这速度在未来将更加迅速。

4、完善一句多对应功能:此处一句多对应指的是一句原文对应多条翻译结果,即一句原文翻译后将出现多种不同表达方式但意思一样/相近的译文,语句将按照相近程度依次排列。

5、关键词延伸:将搜索引擎的部分模式引入翻译工具,程序将根据用户的输入词句进行关键字词的匹配,最终像网页搜索结果般的呈现在用户面前。

“如果这些都变成现实,准确率达到100%,那单纯的翻译工作者岂不是会被淘汰?”答案显然是否定的,原因有三:其一,以上工作之所以称之为完善,那是因为这是一个长期持续的过程,并且所有原始语句都是需要人为录入数据库的,这任务量也是极其繁重的。其二,准确率也无法达到100%,100%只是人们口中常说的一个最理想状态罢了。其三,翻译工具仅是为了提高人们的工作学习效率,这只是笔译中的一个辅助工具,它无法代替如口译类似的工作,也无法代替人们反应迅速的大脑,更无法提供人与人之间的情感表达。

以上五点做法,工作量十分之大

同时这对翻译团队的语言功底要求较高

尤其是对本地语言文化的理解

这可以毫不夸张的说是一项全人类的宏伟目标了

全球化不会停止,翻译的需求便会不断增大

有需求便有市场,翻译工具的完善更不会停止

小编只是希望这速度能够更快些

如此一来,各国的交流便能更加畅通与高效了

图文编辑 / 吹泡泡

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171229B0EC3000?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券