首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何实现句子与其翻译之间的词级对齐?

如何实现句子与其翻译之间的词级对齐?
EN

Stack Overflow用户
提问于 2022-08-24 14:48:40
回答 1查看 120关注 0票数 2

我想要对齐源和目标句子在多语种的翻译设置。

从概念上讲,我想对一个示例性英语源句和一个德语目标句做以下几点:

代码语言:javascript
运行
复制
0   1   2   3    4       5   6      7
i   saw the man  walking on  the    street  
ich sah den mann auf     der straẞe gehen

字级对齐为: 0-0 1-1、2-2、3-3、4-7、5-4、6-5、7-6

或在源句和目标句之间长度不同的情况下:

代码语言:javascript
运行
复制
0  1   2    3         4   5  6        7   8    9
it is  a    different way of saying   the same thing
es ist eine andere    art ,  dasselbe zu  sagen

字级对齐应类似于: 0-0 1-1、2-2、3-3、4-4、5-5、6-7、8-6、8-6、9-6。

实现这一目标的最佳方法是什么?谢谢你的建议!

EN

回答 1

Stack Overflow用户

发布于 2022-09-15 08:27:14

根据您的效率要求,您可以使用各种工具。有一个非常古老和非常快的工具叫做FastAlign。首先需要对并行数据进行培训,而且似乎没有预先训练过的模型。

基于预先训练的多语言变压器的一个非常精确的工具是SimAlign。它是没有监督和工作的,立即超过100种语言,然而,它是相当的计算要求。

使用一个名为AwesomeAlign的工具可以获得更好的结果。它基于SimAlign,但它允许使用并行数据进行进一步的培训。

(您的示例是英语-德语,在凸面轮毂Opus项目中都有大量并行的英语-德语数据。)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73475246

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档