在gensim LDA中，有没有一种方法可以构建一个文档明智的方法来衡量一个主题是否适合它

、

例如，如果主题A具有以下分布:单词A: 0.6，单词B: 0.3，单词C: 0.1。基于文档中包含单词C的事实，该文档已被归类为主题A。它没有其他单词(既不是来自主题A，也不是来自任何其他主题)。有没有什么指标告诉你，即使它被分配了主题A，它也是一个弱分配

浏览 56提问于2021-03-22得票数 0

1回答

在Python中使用Gensim进行主题建模

、、、、

我有两节课的单词清单。假设n项在A类中，m项在类B中。我希望在python中使用gensim包(用于LDA)的主题建模，以便为A类和B类训练一个模型，同时我对主题建模和Python都很陌生。我的意思是，我应该把每个班级的所有包和使用的gensim合并起来，还是应该单独使用每个项目的包？谢谢!

浏览 3提问于2014-12-05得票数 1

回答已采纳

1回答

Gensim获取文档的主题(见文档)

、、

我知道，在对gensim的lda模型进行培训之后，我们可以通过以下方法获得一个看不见的文档的主题：doc_lda = lda[doc_bow] 但是，那些已经用于培训的文档呢？我的意思是，是否有一种

浏览 3提问于2014-04-12得票数 8

回答已采纳

3回答

我已经在text_corpus上使用gensim训练了LDA模型。>lda_model = gensim.models.ldamodel.LdaModel(text_corpus, 10) 现在，如果必须推断一个新的文本文档text_sparse_vector，我必须这样做类gensim.models.ldamodel.LdaModel具有名为show_topics(topics=10，topn=10，log=False，for

浏览 3提问于2012-12-17得票数 1

1回答

如何使用主题模型(LDA)输出来匹配和检索新的、相同主题的文档

、、

我在语料库上使用一个LDA模型来学习它所涵盖的主题。我正在使用gensim包(例如，gensim.models.ldamodel.LdaModel)；如果需要，可以很容易地使用其他版本的LDA。我的问题是，使用参数化模型和/或主题词或主题is查找和检索包含主题的新文档的最有效

浏览 5提问于2016-10-25得票数 0

回答已采纳

1回答

标签的LDA* (gensim)*

、、

我使用Gensim包进行主题建模。这个想法是为了理解flickr标签中的主题是什么。到目前为止，我使用的是这个代码(文档是标签)： texts = [[word for word in document.split(";") if word not in stoplist] forLDA，然后为每个主题打印最可能的10个单词。这是正确的吗？或者，我是否必

浏览 3提问于2016-03-04得票数 2

1回答

如何在gensim中使用models.hdpmodel - Hierarchical Dirichlet过程获取文档主题

、、、、

我只是为了主题建模而学习gensim。当我使用 lda_model = gensim.models.ldamodel.LdaModel(...)结果lda_model有两个函数: get_topics()和get_document_topics()。我可以通过它们找到主题-word和文档-主题。但是，我想尝试一下： hdp_lda_model = gensim.models.hdpmodel.Hdp

浏览 108提问于2019-12-20得票数 1

回答已采纳

1回答

使用gensim进行词聚类

、、、、

我刚接触gensim，我读过关于的文章，据我所知，它创建了一个带有主题和单词的模型，并试图将它们联系起来。在我的公司，我们有一个短语列表，我们使用一个使用Damerau-Levenshtein距离公式的脚本对它们进行过滤后手动对它们进行聚类(实际上，这个数据是在Elasticsearch上的，我们使用fuzzyness我的问题是:这个ge

浏览 0提问于2017-05-18得票数 1

1回答

在自然语言中比较几个语料库的最佳方法是什么？

、、、、

我一直在为一个研究项目(使用Gensim和python)用自然语言编写叙事报告的LDA主题模型。我有几个较小的语料库(每个语料库从1400到200个文档-我知道，这很小！)我想进行比较，但除了查看每个LDA模型(例如使用pyLDAviz)之外，我不知道如何进行比较。我的学术背景不是CS，而且我对NLP还是个新手。在语料库/主题模型中比较主题的一些好<e

浏览 0提问于2017-09-01得票数 4

1回答

基于Gensim的多个语料库的潜在Dirichlet分配

、、、

我有两个与gensim的使用有关的问题。 1)如何使用一个语料库创建一个模型，保存它，或者通过在另一个语料库上对模型进行训练来扩展它？有可能吗？( 2) LDA是否可以用来分类一个看不见的文档，或者需要通过将它包含在语料库中来重新创建模型？有没有一种在线的方

浏览 1提问于2015-05-31得票数 0

回答已采纳

1回答

如何从原语料库中包含最大句子的句子语料库中求出最小的句子？

、、、、

我有一个“优化”问题，我真的不知道我应该从哪一个方向出发。下面是对我问题的描述：语料库：包含原始语料库最大值

浏览 1提问于2017-02-16得票数 0

回答已采纳

3回答

使用从潜在Dirichlet分配派生的主题对文档进行聚类

、、

我想对一个项目使用潜在的Dirichlet分配，我正在使用Python和gensim库。在找到主题之后，我希望使用k-方法这样的算法对文档进行聚类(理想情况下，我希望对重叠的集群使用一个很好的方法，因此欢迎任何建议)。我设法得到了这些主题，但它们的形式如下： 0.041*部长+0.041*关键+0.041*瞬间+0.041*有争议的</e

浏览 0提问于2014-11-13得票数 9

1回答

如何测试文本聚类应用程序？

、、

我正在开发一个根据主题对文档进行集群的应用程序。我使用LDA (潜在的Dirichlet分配)算法。现在原型已经准备好了，也有了一些结果。一个主题内的文件确实是关于这个主题</em

浏览 2提问于2014-01-10得票数 0

1回答

是否有一种方法可以从gensim* LDA预先训练的模型中推断出在看不见的文档上的主题分布？*

、、

是否有一种方法可以在不使用LDA_ModelunseenDoc语法的情况下使用经过预先训练的LDA模型来获得未见文档的主题分布？我正在尝试将我的LDA模型实现到一个web应用程序中，如果有一种方法可以使用矩阵乘法来获得类似的结果，那么我可以

浏览 6提问于2020-06-04得票数 0

回答已采纳

1回答

Gensim主题建模，并提供建议的初步投入？

、、

我正在使用python中的gensim在一个中等大小的语料库上做am主题模型。我们已经大致知道了一些我们期待的话题。特别是，我们知道语料库中确实存在一个特定的主题，我们希望模型能够为我们找到这个主题，这样我们就可以提取出属于这个主题的语料库的元素。有没有一种方法</e

浏览 8提问于2022-10-31得票数 -1

1回答

在R的潜在狄利克雷分配(LDA)中，一个特定主题的项的概率是多少

、、、

我在R中工作，打包“topicmodel”。我正在努力工作，更好地理解代码/包。在我正在阅读的大多数教程和文档中，我看到人们通过5个或10个最可能的术语来定义主题。在lda对象中，我可以访问gamma元素，它包含每个文档涉及每个主题的可能性。因此，基于此，我可以提取概率大于任何我喜欢

浏览 4提问于2017-05-15得票数 3

3回答

对于动态主题模型，有没有高效的python库，最好是扩展Gensim？

、、、、

我正在尝试使用主题模型对twitter流数据进行建模。Gensim是一个易于使用的解决方案，它的简单性令人印象深刻。它有一个真正的LSI在线实现，但不是LDA。对于像twitter这样不断变化的内容流，动态主题模型是理想的选择。有没有什么方法，或者甚至是黑客--一种实现，或者甚至是一种策略，我可以</e

浏览 2提问于2014-03-18得票数 6

1回答

语料库的整体主题分布，而不是单个文档

、、、、

我正在使用gensim LDA进行主题建模。我需要获取语料库的主题分布，而不是单个文档的主题分布。假设我有1000个文档，属于10个不同的类别(假设每个类别有100个文档)。在训练了1000个文档的LDA模型之后，我想看看每个类别的主要主题是什么。下图说明了我的数据集和目标。到目前为

浏览 22提问于2018-10-19得票数 0

2回答

在LDA中指定词汇表输入

、、、、

我正在尝试理解如何在我的案例中使用LDA。我有一个包含许多文档的语料库，我想看看一组非常具体的单词和ngram是如何跨主题分布的。有没有一种方法可以指定特定单词的列表作为主题建模的词汇表？我一直在使用gensim实现，我相信参数id2word可以处理这个问题，但是文档

浏览 12提问于2020-02-18得票数 0

2回答

有必要将TF-IDF应用于gensim* LDA模型中的新文档吗？*

我在上关注“英语维基百科”的基因教程doc_lda = lda[doc_bow] LDA是否只需要词袋向量？

浏览 89提问于2017-06-27得票数 10

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Python中使用Gensim进行主题建模

Gensim获取文档的主题(见文档)

如何在gensim中获取LDA模型中的主题编号

如何使用主题模型(LDA)输出来匹配和检索新的、相同主题的文档

标签的LDA* (gensim)*

如何在gensim中使用models.hdpmodel - Hierarchical Dirichlet过程获取文档主题

使用gensim进行词聚类

在自然语言中比较几个语料库的最佳方法是什么？

基于Gensim的多个语料库的潜在Dirichlet分配

如何从原语料库中包含最大句子的句子语料库中求出最小的句子？

使用从潜在Dirichlet分配派生的主题对文档进行聚类

如何测试文本聚类应用程序？

是否有一种方法可以从gensim* LDA预先训练的模型中推断出在看不见的文档上的主题分布？*

Gensim主题建模，并提供建议的初步投入？

在R的潜在狄利克雷分配(LDA)中，一个特定主题的项的概率是多少

对于动态主题模型，有没有高效的python库，最好是扩展Gensim？

语料库的整体主题分布，而不是单个文档

在LDA中指定词汇表输入

有必要将TF-IDF应用于gensim* LDA模型中的新文档吗？*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐