我想做一个新的实体:让我们称之为“医学”,然后用我的语料库来训练它。从那里,确定“医学”的所有实体。不知怎么我的代码不起作用了,有人能帮我吗?import nltk
test1= input("Please enter your second file(sample1)
tokenized_sentences = [nltk.word_tokenize(sentence) for sent
我最近受命构建一个名称实体识别器,作为项目的一部分。目的是分析给定的句子,并提出所有可能的实体组合。这将省略句子中的名称实体。然后在另一个查找表中对这些标识的实体进行查找,这些实体与实体类型相关联,例如,如果句子是:Remember the Titans was a movie directed by Boaz Yakin,则可能的输出如下导演}}记住{巨人,电影,运动队}是一部电影导演波阿兹Yakin回忆{巨人,电影,运动队}是{一部电影,电影导演波