我用了三个平行的句子文件来训练我的自定义翻译模型。没有字典文件,也没有调优文件。训练结束后,我检查了测试结果,我想在模型中做一些调整。以下是几个问题:
发布于 2020-04-15 09:27:49
我希望在这方面有更多权威的答案,我将分享我知道的作为一个伙伴用户。
微软自定义翻译器所称的"调谐数据“通常被称为验证集。这只是一种避免过度适应的方法。
是的,使用Microsoft自定义翻译器,您只能根据为项目选择的泛型类别来训练模型。
(从技术上讲,使用Google AutoML,您可以选择根据以前的自定义模型之一来训练新模型。然而,如果没有一些尝试和错误,它也是不可用的。)
很难对此发表明确的声明。培训集也有效果。在一个糟糕的训练集之上,一个好的验证集不会给我们带来好的结果。
是的,在我看来,如果你让它决定如何将训练集分成训练集、调优集和测试集,你只能下载训练集和测试集。
也许这两种方法都不包括调优集,所以理论上你可以区分它们。但这并不能解决不同模型之间的分裂问题。
问得好。
https://stackoverflow.com/questions/61133278
复制相似问题