首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用Stanford NER在多个文件上标记网元

使用Stanford NER在多个文件上标记网元
EN

Stack Overflow用户
提问于 2012-06-04 20:44:50
回答 1查看 383关注 0票数 1

我想使用Stanford NER来标记多个文件中的实体。在文档中,我们可以使用带有逗号分隔的测试文件列表的选项-testFiles,但它在我的示例中不起作用,如下所示:

代码语言:javascript
运行
复制
java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier
     -loadClassifier ner-model.ser.gz -testFiles Test_file1.tsv,Test_file2.tsv

但当我们只输入一个文件时,它就会起作用。

系统是否也对所有多个文件进行内联评估(针对P、R)?我只是想知道在有多个文件的情况下它是如何工作的。

提前谢谢。

卡达卡

EN

回答 1

Stack Overflow用户

发布于 2019-11-06 17:45:11

你必须使用prop.txt文件才能使用多个tsv文件。检查此链接

https://nlp.stanford.edu/software/crf-faq.html#mfiles

以下是来自NER常见问题页面的代码片段

如何从多个文件训练一个模型?

设置trainFileList属性或标志,而不是设置trainFile属性或标志。使用逗号分隔的文件列表。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10881527

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档