是否有一个更短、更干净或内置的方法来删除匹配结果中的重叠匹配结果,同时也保留用于匹配的模式的值?这样你就可以知道哪种模式能给出匹配的结果。模式ID最初是从matcher结果中给出的,但是解决方案消除了我看到的删除ID号的重叠。下面是我目前使用的解决方案,它可以工作,但有点长:from spacy.lang.en import English
from spacy.matcher</
我想实现一些文本操作,作为对关键短语提取的预处理。请看下面的示例:text = "conversion of existing underground gas storage facilities into storagefacilities dedicated to hydrogen-storage"
doc = nlp(text)
print(f'
我是斯派西的新手,我读过关于标记基匹配的文档。我已经尝试过使用REGEX的spaCy匹配器,但是我没有任何结果。我是不是在代码中做错了什么。我在试着匹配“accès”这个词# REGEXtext = u"accès'd est ferme aujpourd'hui"import spacy
from sp