首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Spacy NER模型中新实体的训练

Spacy NER模型中新实体的训练
EN

Data Science用户
提问于 2021-10-06 05:11:50
回答 1查看 86关注 0票数 0

我想向python spacy NER模块添加新的实体。我对此毫不怀疑。

  1. 是否有可能移除一些现有实体,并将新实体添加到其余实体中。
  2. 在培训新的实体时,我发现我们必须以特定的格式提供培训数据。例如,data =[(“我爱鸡”,(8,13,“食物”)),.]

而不是像“我爱鸡”这样的句子,能不能给出这样的数据

代码语言:javascript
运行
复制
data = [
    ("chicken", [(1, 8, "FOOD")]),
    ... 
]

这会影响准确性吗。

EN

回答 1

Data Science用户

发布于 2021-10-06 15:26:33

这不是NER的工作方式:

  • NER不是只识别一组固定的实体,而是检测文本中的任何实体。例如,它应该在“X先生说.”中发现一个实体。无论X是“约翰·史密斯”还是“唐老鸭”。
  • 这意味着NER使用句子中的线索来检测实体,而不是仅仅标记它从训练中知道的实体。

因此

  1. 是否有可能移除一些现有实体,并将新实体添加到其余实体中。

不,因为NER模型不是实体列表,所以它是一个使用文本特性的复杂模型。

  1. 可以给出像...这样的数据吗?

从技术上讲,你可以给出这样的数据,但这不是它应该工作的方式。

您似乎对精确匹配一组预定义的实体感兴趣,NER不是正确的工具。在这个场景中,将实体存储在列表中并将字符串匹配应用到文本中要简单得多。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/102835

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档