首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >自定义翻译器-培训后的模型调整

自定义翻译器-培训后的模型调整
EN

Stack Overflow用户
提问于 2020-04-10 02:45:38
回答 1查看 86关注 0票数 2

我用了三个平行的句子文件来训练我的自定义翻译模型。没有字典文件,也没有调优文件。训练结束后,我检查了测试结果,我想在模型中做一些调整。以下是几个问题:

  1. 训练后可以调整模型吗?我说的对吗?这个模式是不能改变的,唯一的办法就是培养一个新的模式?
  2. 调整模型的最佳方法是使用调优文件。这是正确的吗?
  3. 无法看到自动生成的调优文件,因此我必须提供自己的调优文件,以便进行更易于管理的调优过程。是这样吗?
  4. 请描述如何生成调优文件,当我有3个不同数量的句子文件,即: 55k,24k和58k行。所有的调优句子都是从第一个文件还是从所有三个文件中按比例调整它们的大小?使用哪种逻辑?
EN

回答 1

Stack Overflow用户

发布于 2020-04-15 09:27:49

我希望在这方面有更多权威的答案,我将分享我知道的作为一个伙伴用户。

微软自定义翻译器所称的"调谐数据“通常被称为验证集。这只是一种避免过度适应的方法。

  1. 训练后可以调整模型吗?我说的对吗?这个模式是不能改变的,唯一的办法就是培养一个新的模式?

是的,使用Microsoft自定义翻译器,您只能根据为项目选择的泛型类别来训练模型。

(从技术上讲,使用Google AutoML,您可以选择根据以前的自定义模型之一来训练新模型。然而,如果没有一些尝试和错误,它也是不可用的。)

  1. 调整模型的最佳方法是使用调优文件。这是正确的吗?

很难对此发表明确的声明。培训集也有效果。在一个糟糕的训练集之上,一个好的验证集不会给我们带来好的结果。

  1. 无法看到自动生成的调优文件,因此我必须提供自己的调优文件,以便进行更易于管理的调优过程。是这样吗?

是的,在我看来,如果你让它决定如何将训练集分成训练集、调优集和测试集,你只能下载训练集和测试集。

也许这两种方法都不包括调优集,所以理论上你可以区分它们。但这并不能解决不同模型之间的分裂问题。

  1. ..。使用哪种逻辑?

问得好。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61133278

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档