首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >NER评价指标

NER评价指标
EN

Data Science用户
提问于 2020-08-08 17:09:47
回答 1查看 1.3K关注 0票数 2

我试着在带注释的语料库上比较两个NER工具,我不确定哪一个是最好的度量标准,因为我以前从未使用过NER模型。具体来说,我只对一个类感兴趣,所以我想在这个特定的类上对它们进行评估。

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-08-09 00:10:37

一个很好的起点是查看在NER共享任务:https://nlpprogress.com/english/named_实体_recognition.html中使用的评估度量。

通常,F1-得分可以用于一个特定的类,但是对于被计算为实例的是什么,有不同的选项:

  • 每发生一次完全的NE。在这种情况下,预测与黄金之间的任何差异都被认为是假的,即使这只是一个象征性的差异。
  • 一个实体中的每一个标记。在这种情况下,部分匹配的实体算作“部分正确”:如果一个单词是在外部而不是在内部预测的,则它是假否定的,相反。
  • 其他变体:
    • 只计算唯一的实体,以观察所承认的实体的多样性。
    • 只计算训练集中未出现的实体,以观察泛化能力。

(从记忆中写这篇文章,我可能会错过一些东西)

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/79985

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档