我正在尝试从NLTK的Gutenberg数据集中加载数据。我从数据集中加载词汇表,不包括任何标点符号,并使用它来创建单词到整数的映射字典。但是,当我稍后解析句子并尝试应用映射时,我得到一个键错误,因为它试图在字典中查找'"*'。word in sentence:
x = word_to_int[word] #KeyError: '"*' 我理解为什么当我去掉标点符号时,这种符号组合没有被捕捉到,但由于我对单词</e
从论文中可以看出,在两个命名实体之间的关系中采用监督学习功能的简单步骤之一是* the part ofspeech tags of these words两个实体之间的单词数量不应该根据您正在查看的训练句子而变化吗?例如,请参阅以下两个句子,用于学习具有关系的个人和组织:
1. Mike is the owner of the company cal