首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能与翻译

人工智能,英文缩写为AI,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

人工智能翻译

实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。

1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。

2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。

3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。

深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。

智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在“短板”,会有“词不达意”的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。

1、大量补充口语化语料

智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。

2、提高语境理解能力

智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210315A05NB600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券