开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >NER评价指标

问NER评价指标
EN

Data Science用户

提问于 2020-08-08 17:09:47

回答 1查看 1.3K关注 0票数 2

我试着在带注释的语料库上比较两个NER工具，我不确定哪一个是最好的度量标准，因为我以前从未使用过NER模型。具体来说，我只对一个类感兴趣，所以我想在这个特定的类上对它们进行评估。

model-evaluations

named-entity-recognition

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-08-09 00:10:37

一个很好的起点是查看在NER共享任务：https://nlpprogress.com/english/named_实体_recognition.html中使用的评估度量。

通常，F1-得分可以用于一个特定的类，但是对于被计算为实例的是什么，有不同的选项：

每发生一次完全的NE。在这种情况下，预测与黄金之间的任何差异都被认为是假的，即使这只是一个象征性的差异。
一个实体中的每一个标记。在这种情况下，部分匹配的实体算作“部分正确”：如果一个单词是在外部而不是在内部预测的，则它是假否定的，相反。
其他变体：
- 只计算唯一的实体，以观察所承认的实体的多样性。
- 只计算训练集中未出现的实体，以观察泛化能力。

(从记忆中写这篇文章，我可能会错过一些东西)

票数 3

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/79985

复制

相似问题