我一直在为一个项目使用Rasa NLU,该项目涉及到结构化文本的意义。我的用例要求我通过添加文本语料库实体的新示例来不断更新我的培训集。然而,这意味着我必须每隔几天再对我的模型进行再培训,因此由于培训集的规模增加,因此需要更多的时间进行同样的培训。
Rasa NLU是否有办法只使用新的培训集数据来更新已经培训过的模型,而不是使用整个以前的培训数据集和新的培训数据集再培训整个模型?
我试图寻找一种方法,通过每隔几天就可以通过增量额外的培训数据集来更新我现有的经过培训的模型。
发布于 2018-05-16 09:50:49
到目前为止,关于这个主题的最新的Github 问题指出,没有办法重新训练一个模型,只添加新的话语。其中提到的先前问题也是如此。
你说得对:必须定期对越来越长的文件进行再培训变得越来越费时。不过,在生产方面,再培训并不是一个好主意。
用户评论中的优秀示例:
同样的模式下的再培训可能是生产系统的一个问题。我过去常常重写我的模型,然后在某一时刻,其中一次训练效果不佳,我开始看到我的反应信心严重下降。我不得不找出问题出在哪里,并重新培训了模型。 一直培训新模型(带有时间戳)是很好的,因为它使回滚变得更容易(而且它们将发生在生产系统中)。然后从DB中获取最新的模型名称。
https://stackoverflow.com/questions/50343099
复制相似问题