Gensim LDA :错误:无法在空集合(无术语)上计算LDA

、、、

我遇到了与这个线程相同的错误：ValueError: cannot compute LDA over an empty collection (no terms)，但所需的解决方案并不相同。我正在和Sklearn一起开发一个笔记本，我已经完成了LDA和NMF。我现在正在尝试使用Gensim做同样的事情：https://radimrehurek.com/gensim/auto_examples/tutorials/run_lda.

浏览 1021提问于2021-04-23得票数 0

回答已采纳

1回答

ValueError:无法在空集合上计算LDA (没有条款)

、、、

当试图为较小的语料库计算lda时，python中会出现此错误，但在其他情况下效果很好。语料库的大小为15，我尝试将主题的数目设置为5，然后将其降为2，但它仍然给出了相同的错误：ValueError:无法在空集合(无术语)上计算LDA。在这一行中获取错误：lda = models.LdaModel(corpus, num_topics=topic_number, i

浏览 0提问于2016-11-28得票数 2

回答已采纳

3回答

gensim.interfaces.TransformedCorpus -如何使用？

、

在潜在的Dirichlet分配领域，我是相对较新的。我能够按照维基百科教程生成一个LDA模型，并且能够用我自己的文档生成一个LDA模型。我现在的步骤是尝试理解如何使用以前生成的模型来分类未见的文档。mm = gensim.corpora.MmCorpus('ptwiki_tfidf.mm') lda = gensim.models.ldamodel.LdaModel(corpus"new_doc.txt"，我将我的文档转换为id<-

浏览 5提问于2017-07-26得票数 9

回答已采纳

1回答

计算一致性评分中的错误- AttributeError：'dict‘对象没有属性'id2token’

、、、、

从df ->稀疏矩阵-> gensim语料库将术语文档矩阵转换为一种新的gensim格式。)) coherence_model_lda = CoherenceModel(model=lda, texts=df_lemmatized.long_title, dictionary=id2word, coherence='c_v') coherence_lda = coherence_model_

浏览 6提问于2019-11-25得票数 0

回答已采纳

1回答

试图利用一个库进行一些主题建模，但并不顺利

、、、

我有一个.csv术语文档矩阵，我想在python中使用gensim执行一些潜在的dirichlet分配。但是，我对Python或LDA并不特别熟悉。你的术语文件CSV矩阵有多大？看看它的documents_columns标志，它可以让您轻松地在文档术语和术语文档转换之间切换. 因此，这使我相

浏览 2提问于2020-03-11得票数 0

回答已采纳

2回答

Gensim LDA一致性评分南

、、、、

我创建了一个Gensim LDA模型，如本教程所示：它生成10个主题，log_perplexity为： lda_model.log_perplexity(data_df‘’bow_

浏览 0提问于2020-02-16得票数 8

回答已采纳

2回答

基于Mallet困惑的Gensim主题建模

、、、、

我使用Gensim Mallet包装与Mallet的LDA建模。当我试图得到一致性和困惑值来看模型有多好时，困惑无法计算出下面的例外。如果我使用Gensim的内置LDA模型而不是Mallet，我就不会得到相同的错误。我的语料库中包含的7M+文档长达50字，平均20字，所以文档很短。LDA model lda_model = gensim.models.ldamodel.LdaModel(corpus=corpus,(

浏览 5提问于2019-03-21得票数 1

2回答

Python: Gensim内存错误

、、

= models.LdaModel(corpus, id2word=dictionary, num_topics=100)#corpus_lda = lda[corpus] # print(doc) 我正在运行Gensim进行主题建模，并尝试让上面的代码正常工作。我知道这段代码能够工作是因为我的朋友在一台mac电脑上运行了它，并且运行得很成功，但是当我在一

浏览 1提问于2015-09-13得票数 1

1回答

如何使用gensim的LDA从查询中进行文本检索？

、、、

我试图了解LDA如何用于文本检索，我目前正在使用gensim的LdaModel模型来实现LDA，这里是：。我成功地识别了k个主题和它们最常用的单词，我知道LDA是关于主题的概率分布，以及单词如何在文档中的主题中分布，所以这很有意义。我尝试在搜索查询中推断主题分布，并使用gensim的similarities.MatrixSimilarity计算余弦相似度，找出搜索查询上的主题分布与语料库中的主题分布之间的相似之处： lda = Lda

浏览 0提问于2018-04-26得票数 3

回答已采纳

1回答

如何定义最优的主题数量(k)？

、、

我想知道这是提供给gensim的LDA的最佳主题数(k)，我已经在StackOverflow上找到了答案。然而，我得到了下面提到的一个错误。What is the best way to obtain the optimal number of topics for a LDA-Model using Gensim?, CoherenceModel

浏览 59提问于2020-11-09得票数 1

回答已采纳

1回答

从Gensim* LDA或pyLDAvis中提取单词显着性*

、、、

我看到pyLDAvis在每个主题下可视化每个单词的显着性。但是，我们有没有办法提取每个主题下每个单词的显着性？或者如何使用Gensim LDA直接计算每个单词的显着性？所以最后，我想要得到一个pandas数据帧，一行表示一个单词，每列表示每个主题，它的值表示单词在相应主题下的显着性。在此之前，非常感谢您。

浏览 16提问于2021-10-15得票数 1

1回答

从招聘广告中提取相关关键词

、

从求职者的角度来看，我们试图解决的问题是在简历中为每一份求职申请设置正确的关键词，从而增加了你获得面试入围名单的机会。这是特别重要的，当第一阶段的筛选是通过机器人扫描关键字。技能和经验：以前的出纳员经验(在过去5年内)理想；以前的客户服务经验(财务)理想；能够在快节奏和时间紧迫的环境中工作；出色的表现和态度；对细节的高度重视；能够快速掌握多个软件包

浏览 2提问于2017-02-01得票数 0

回答已采纳

1回答

IndexError在更新gensim的LdaModel时

、、、、

在更新gensim的时，我面临以下错误： first_iter = Truelda_gensim =chunk_no, t1-t0)) print("Finished g

浏览 2提问于2018-05-07得票数 3

回答已采纳

2回答

有必要将TF-IDF应用于gensim* LDA模型中的新文档吗？*

我在上关注“英语维基百科”的基因教程doc_lda = lda[doc_bow] LDA是否只需要词袋向量？

浏览 89提问于2017-06-27得票数 10

回答已采纳

3回答

Python Gensim:如何使用LDA模型计算文档相似度？

、、、

我有一个经过训练的LDA模型，我想从我训练模型的语料库中计算两个文档之间的相似度分数。在学习了所有的Gensim教程和函数后，我仍然无法理解它。有人能给我个提示吗？谢谢!

浏览 1提问于2014-03-16得票数 33

回答已采纳

0回答

尝试保存模型时，gensim* lda权限被拒绝*

、、、

这是一个代码片段，尽管我需要更多的时间才能写出可重现的代码，因为我实际上只是想加载我预先创建的某些文件。= gensim.models.ldamodel.LdaModel ldamodel = Lda(doc_term_matrix, num_topics=15, id2word = doc_dict,现在，即使是原始的models/目录位置也给了我“权限被拒绝”，并显示此错误消息。它看起来像是我可以使用的所有目录...行不通的。这是奇怪的行为，我真的找不到在相同的上下文中谈论这个错误<

浏览 3提问于2018-07-20得票数 1

1回答

2没有这样的文件或目录

、、、

我保存了一个LDAWallet模型： mallet_path = 'mallet-2.0.8/bin/mallet'在培训模式时，我忘记了将前缀设置为某个文件，因此，在培训时，我丢失了gensim创建的所有临时文件(doctopics等)。正因为如此，当我加载模型并想预测主题时： model_lda = gensim</

浏览 4提问于2020-03-09得票数 0

1回答

在Python gensim主题模型中访问字典

、、、、

我想看看如何从gensim lda主题模型访问字典。当您训练lda模型时，这一点尤其重要，稍后保存并加载它。换句话说，假设lda_model是在一组文档上训练的模型。words WORD = re.compile(r'\w+') return words from gensim.corpora.dictionaryregTokenize(d)

浏览 39提问于2021-01-25得票数 1

回答已采纳

4回答

pyLDAvis:尝试可视化主题时出现验证错误

、、、

我尝试使用gensim为300000条记录生成主题。在尝试可视化主题时，我得到了一个验证错误。我可以在模型训练后打印主题，但在使用pyLDAvis时失败ldamodel1= gensim.corpora.MmCorpus('corpus.mm') lda = gensim.models.LdaModel.lo

浏览 173提问于2017-12-28得票数 8

2回答

LDA gensim实现，两个不同文档之间的距离

、、

表明，gensim在训练和推理步骤中都使用随机性。因此，这里建议设置一个固定的种子，以便每次都能获得相同的结果。为什么我对每个主题都得到相同的概率？有没有可能为gensim中的每个用户计算相同的主题，或者我必须计算主题字典并对每个用户主题进行聚类？一般来说，基于gensim中的主题模型提取来比较两个twitter用户的最佳方式是什么？问题2:使用之前计算的LDA模型，训练几个twitter用户的LDA模型，并计算每

浏览 0提问于2014-06-26得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

ValueError:无法在空集合上计算LDA (没有条款)

gensim.interfaces.TransformedCorpus -如何使用？

计算一致性评分中的错误- AttributeError：'dict‘对象没有属性'id2token’

试图利用一个库进行一些主题建模，但并不顺利

Gensim LDA一致性评分南

基于Mallet困惑的Gensim主题建模

Python: Gensim内存错误

如何使用gensim的LDA从查询中进行文本检索？

如何定义最优的主题数量(k)？

从Gensim* LDA或pyLDAvis中提取单词显着性*

从招聘广告中提取相关关键词

IndexError在更新gensim的LdaModel时

有必要将TF-IDF应用于gensim* LDA模型中的新文档吗？*

Python Gensim:如何使用LDA模型计算文档相似度？

尝试保存模型时，gensim* lda权限被拒绝*

2没有这样的文件或目录

在Python gensim主题模型中访问字典

pyLDAvis:尝试可视化主题时出现验证错误

LDA gensim实现，两个不同文档之间的距离

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐