我想使用Stanford NER来标记多个文件中的实体。在文档中,我们可以使用带有逗号分隔的测试文件列表的选项-testFiles,但它在我的示例中不起作用,如下所示:
java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier
-loadClassifier ner-model.ser.gz -testFiles Test_file1.tsv,Test_file2.tsv但当我们只输入一个文件时,它就会起作用。
系统是否也对所有多个文件进行内联评估(针对P、R)?我只是想知道在有多个文件的情况下它是如何工作的。
提前谢谢。
卡达卡
发布于 2019-11-06 17:45:11
你必须使用prop.txt文件才能使用多个tsv文件。检查此链接
https://nlp.stanford.edu/software/crf-faq.html#mfiles
以下是来自NER常见问题页面的代码片段
如何从多个文件训练一个模型?
设置trainFileList属性或标志,而不是设置trainFile属性或标志。使用逗号分隔的文件列表。
https://stackoverflow.com/questions/10881527
复制相似问题