我有一个数据帧,它看起来像 Index Text
1 Who is king Arthur?使用spacy,我尝试从dataframe的每一行中提取名称,使我的输出看起来像这样 Index Text Name
0Canada‘作为输出,这是我不想要的。token.label_ for token in nlp(x).en
我正在研究具有(14640,16)形状的,使用Pandas和Spacy进行预处理,但在获取lemmetized形式的文本时有问题。此外,如果我使用仅包含文本列的pandas系列(即只包含一列的数据帧),也会出现不同的问题。(x))结果:
之后,我使用parsed_tweets遍历列,以获得列表化的数据,但得到了错误。代码:
for token