我遇到了与这个线程相同的错误:ValueError: cannot compute LDA over an empty collection (no terms),但所需的解决方案并不相同。我正在和Sklearn一起开发一个笔记本,我已经完成了LDA和NMF。我现在正在尝试使用Gensim做同样的事情:https://radimrehurek.com/gensim/auto_examples/tutorials/run_lda.
当试图为较小的语料库计算lda时,python中会出现此错误,但在其他情况下效果很好。语料库的大小为15,我尝试将主题的数目设置为5,然后将其降为2,但它仍然给出了相同的错误:ValueError:无法在空集合(无术语)上计算LDA。在这一行中获取错误:lda = models.LdaModel(corpus, num_topics=topic_number, i
我想知道这是提供给gensim的LDA的最佳主题数(k),我已经在StackOverflow上找到了答案。然而,我得到了下面提到的一个错误。What is the best way to obtain the optimal number of topics for a LDA-Model using Gensim?, CoherenceModel
我想看看如何从gensimlda主题模型访问字典。当您训练lda模型时,这一点尤其重要,稍后保存并加载它。换句话说,假设lda_model是在一组文档上训练的模型。words WORD = re.compile(r'\w+') return words
from gensim.corpora.dictionaryregTokenize(d)