在使用以下方法训练新模型时:
java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop假设myPropertiesFile.prop中指定的模型已经存在。一个新的模型是从头开始训练,还是从现有参数开始训练?我能控制在这种情况下做些什么吗?
一些上下文:
我想首先在一个非常大的语料库上训练标记者,这个语料库不太准确,然后继续训练一个小得多的精确数据语料库(一个所谓的warm start)。
发布于 2018-05-14 04:39:41
它将从头开始建立一个新的模型。据我所知,没有任何功能可以在一个数据集上对模型进行培训,然后继续对另一个数据集进行培训。您可以修改代码以获取初始特性和权重,然后从那里开始培训,但这并不容易设置。
https://stackoverflow.com/questions/50233486
复制相似问题