我已经使用自定义标记器在spaCy中训练了一个自定义NER模型。我想不使用记号赋予器来保存NER模型。我使用在spaCy支持论坛中找到的代码尝试了以下代码:nlp.tokenizer = some_custom_tokenizerTrain the NER model...
nlp.tokenizer =
我有一个句子已经被标记成文字了。我想得到句子中每个单词的词性标记部分。当我检查SpaCy中的文档时,我意识到它从原始句子开始。我不想这样做,因为在这种情况下,spacy可能会以不同的标记结束。因此,我想知道是否可以在单词列表(而不是字符串)中使用spaCy?下面是我的问题的一个例子:
# I know that it does the follo