因此,我最近一直在尝试与NLP打交道,并决定参与一个涉及Emotional 的项目。我一直在关注这个特别的研究,。
但是,出于这个原因,我无法理解如何实现Sec.III part E (PMI)。我不知道如何建立我的语料库,或窗口的大小,以及如何确定应该在其中。我使用的是Spacy,所以为前面的部分获取信息并不困难。如有任何解释或帮助,将不胜感激。
我有一个句子已经被标记成文字了。我想得到句子中每个单词的词性标记部分。当我检查SpaCy中的文档时,我意识到它从原始句子开始。我不想这样做,因为在这种情况下,spacy可能会以不同的标记结束。因此,我想知道是否可以在单词列表(而不是字符串)中使用spaCy?下面是我的问题的一个例子:
# I know that it does the following suce
根据我的理解,远距离监督是一种过程,它规定了一篇文章中的单个单词,通常是一个句子,试图传达的概念。
例如,数据库维护结构化关系concerns( NLP, this sentence).基于该句子,它将识别实体,因为作为预处理步骤,该句子将通过命名实体识别器NLP & this sentence传递。因为我们的数据库认为NLP和this sentence是