谢谢你的帮助。我使用spacy解析文档,查找特定单词的实例,并在新的dfcolumn中提取句子。以下是一些文本: text = (sent_list)此代码工作良好,并提取包括欧盟实体在内的所有句子。我试着用POS/Dependency把专有名词和动词结合起来,但是nsubj并不总是正确的,或者nsubj连接到<
text和cleaned_text包含字符串文档,nouns是从cleaned_text列提取的名词列表。df.shape = (1927, 3)。我试图仅为名词计算df 中所有文档的spaCy值,不包括spaCy秒词。
from spacy.lang.en import English
# subclass to mo