首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >你能解释一下你是如何计算基线和自定义BLEU分数的吗?

你能解释一下你是如何计算基线和自定义BLEU分数的吗?
EN

Stack Overflow用户
提问于 2019-04-01 19:19:09
回答 1查看 155关注 0票数 0

我理解标记化标准对一个人获得的BLEU分数至关重要,但我不理解的是,为什么当我比较基线BLEU分数或自定义BLEU分数时,会得到不一致的差异。让我解释一下。

例如,我最近训练了一个英语-丹麦语自定义模型,训练集约为300k个片段,测试集约为2k个片段。完成后,我得到了基线的bleu分数为34,63和自定义的bleu分数为48,3。为了仔细检查这些分数,我重新计算了从自定义翻译器门户网站下载的模型“系统测试结果”的bleu分数,使用Moses tokenizer.perl和mult-bleu.perl,使用基线模型我得到的bleu分数为34,16,但是使用自定义模型我得到了41,57。

你如何解释,使用基线模型我得到的分数与我从Microsoft获得的分数非常相似,但是使用自定义模型我得到的分数比我从Microsoft获得的分数低大约7分。丹麦的情况只是一个例子,但这是我在其他几种语言中观察到的行为。

EN

回答 1

Stack Overflow用户

发布于 2019-04-02 09:21:54

您可以联系我们的客户支持别名吗?我想看看你的分词测试数据,并确定为什么会有如此巨大的差异。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55453907

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档