我有一个句子已经被标记成文字了。我想得到句子中每个单词的词性标记部分。当我检查SpaCy中的文档时,我意识到它从原始句子开始。我不想这样做,因为在这种情况下,spacy可能会以不同的标记结束。因此,我想知道是否可以在单词列表(而不是字符串)中使用spaCy?下面是我的问题的一个例子:
# I know that
我试图通过对每个文档的每个单词向量进行求和来比较文档之间的差异,最后找出余弦相似度。例如,如果spacy向量对上面列出的两个‘铅’具有相同的向量,那么结果可能会很糟糕。在下面的代码中,为什么两个'bank'令牌之间的相似性是1.00?import spacy
str1 = 'The guy went inside the
我有一个JavaScript前端和python后端的web应用程序。用户编写一个短语,单击一个按钮,python解析句子(自然语言处理),然后将数据发送回客户端。我使用SpaCy进行自然语言处理。加载SpaCy需要很长时间,所以我想知道在启动服务器时是否可以在NodeJS中预加载SpaCy (而不是每次生成python文件时都导入SpaCy -这就是我现在所做的,参见下面的代码)。谢谢!FILE C
例如,对于一个简单的餐馆聊天机器人,训练文件data.json可能包含 "text": "central indian restaurant",Sample Input: Is there any central Indian restaurant?Sample Output: The above data.json为了更