我正在尝试评估一个自制的主题模型。为此,我使用主题列表(由关键字表示),并希望使用gensim.models.coherencemodel.CoherenceModel
,并在语料库上调用它,语料库是一个字符串列表(每个字符串都是一个文档)。CoherenceModel
需要一个Dictionary
,但我不明白它对应的是什么,以及如何才能获得它。我使用来自sklearn
的TfidfVectorizer
向量化文本,使用来自gensim
的glove
嵌入来计算我的模型中的相似度。
发布于 2020-03-26 00:23:18
在文档中,可以从语料库是list of lists of str
的语料库创建Dictionary
。同样的语料库应该在CoherenceModel
的text
参数中传递。
https://stackoverflow.com/questions/60850956
复制相似问题