调优LDA主题模型_lda主题模型_调优LSTM模型 - 腾讯云开发者社区

gensim、lda、topic-modeling

假设我使用gensim或sklearn构建了一个LDA主题模型，并为每个文档分配了热门主题。但有些文档与指定的热门主题不匹配。除了尝试不同数量的主题或使用连贯性分数来获得最佳主题数量之外，我还可以使用哪些其他技巧来改进我的模型？

浏览 37提问于2021-02-09得票数 0

1回答

如何将预训练结束的LDA模型传递给Gensim for DTM中的ldaseq？

gensim、lda、topic-modeling

我有一个调优和预训练结束的LDA模型，我想把它传递到gensim中的ldaseq模型，但是不知道如何实现它。我尝试过lda_model和sstats，但是它似乎不起作用，我仍然从日志记录中得到了这样的结果：运行在线(多通) LDA培训，10个主题，10个通过所提供的1699文档的语料库，每1699个文档更新一次模型

浏览 4提问于2021-06-16得票数 0

回答已采纳

1回答

如何创建网格搜索来找到最佳参数？

r、topicmodels

在lda分析中 # parameters for Gibbs sampling iter <- 2000topicslibrary(topicmodels) ldaOut <-LDA(Associate

浏览 31提问于2019-08-18得票数 1

回答已采纳

2回答

运行不带参数的插入符号方法

r、r-caret

我正在尝试运行一个不需要参数的插入符号方法，比如lda，下面的例子使用了"lvq“，它需要两个参数(size和k)。., data=iris, method="lda", trControl=control, tuneGrid=NULL)print(model) plot

浏览 3提问于2017-04-06得票数 1

2回答

使用主题建模或另一种NLP方法，是否有可能为定义得更好的主题模型定义属于主题/类别的单词？

python、python-3.x、nlp、lda、topic-modeling

在使用主题建模和考虑LDA & LSA方法时，我遇到了一个问题，然而，我发现有些主题并没有像我喜欢的那样被精确地定义。是否有可能将单词定义为主题，以帮助机器更好更容易地学习？如前所述，我尝试了LDA和LSA技术来进行主题建模，发现LDA是最准确的，其一致性评分为0.46，并重新定义了主题名称。但是，主题中的单词并不反映主题名称，这需要对模型进行调优。技术

浏览 8提问于2022-03-31得票数 1

回答已采纳

1回答

星火CrossValidator如何确定如何应用网格参数

scala、apache-spark、apache-spark-mllib

ML Tuning 的火花文档中的以下片段显然为Hashing TermFrequency设置了numFeatures，为LogisticRegression模型设置了regParam (正则化)： HashingTF一个具体的例子:对于LDAModel：我们有调优参数k、vocabSize和docConcentration：应该如何为这些参数设置ParamGrid？

浏览 0提问于2017-12-07得票数 1

回答已采纳

1回答

如何提高sci学习中潜在dirichlet分配( LDA )的性能？

python、scikit-learn、tf-idf、lda、topic-modeling

我正在运行与健康相关的数据的LDA。具体来说，我有大约500份文件，其中包含了5-7页左右的访谈内容。然而，研究结果突出了两个问题: 1)不清楚主题是什么，因为每个主题中的词语不一定是一起或讲述一个故事；2)不同主题中的许多词语相互重叠，并且在大多数主题中出现了几个单词。我试了tf-以色列国防军和袋字(计数矢量)，但我发现tf-国防军提供了稍微清晰和更明确的主题，同时分析了LDA输出。完成之后，我运行了一个LDA模型。我将主题

浏览 0提问于2018-06-10得票数 2

3回答

如何提高随机森林多类分类模型的精度？

python、machine-learning、random-forest

我曾尝试下列方法，但未能达到50%以上的准确度：我的类是不平衡的，所以我也尝试使用class_weight = balanced，过度采样使用SMOTE，下采样和重采样

浏览 0提问于2018-12-05得票数 2

回答已采纳

1回答

如何寻找lda的最佳措施

r、quanteda

使用实现quanteda包的ldarequire(quanteda.corpora)require(topicmodels)) dtm <- convert(dfmat_news, to = "topicmodels")是否有任何指标可以帮助理解适当数量的主题</e

浏览 0提问于2019-08-12得票数 0

回答已采纳

1回答

卡雷特:尝试预测，但预测行不同

r、machine-learning、r-caret

我已经创建和调优了多个模型，但当我试图预测它们时，我遇到了一些问题。我首先运行我的代码，如下所示，以优化一个LDA模型。classProbs = TRUE, lda_tune这是有问题的，因为我用来自多个模型的预测值创建测试结果的data.frame，以便使用混淆矩阵进行分析。例如，当我运行这个 r

浏览 4提问于2015-08-15得票数 1

回答已采纳

3回答

主题发现/发现的最佳模型

nlp、keyword、information-retrieval、information-extraction、topic-modeling

在简短的非结构化文档中发现主题的最佳模型是什么，例如。短信还是推特消息？潜在的狄利克雷分配？

浏览 2提问于2011-10-07得票数 3

回答已采纳

1回答

文本处理，如何使用LDA分配一个主题-> 1文档？

machine-learning、nlp、topic-modeling、text-classification、gensim

我有两个文件，我想从上面抽取两个主题(Music，Science)lda = gensim.models.ldamodel.LdaModel(corpus=my_corpus, id2word=corpus_dictionary, num_topics=2) print(lda.print_topicnot +

浏览 5提问于2015-04-12得票数 1

3回答

从gensim LDA模型中提取主题分布

gensim、lda、topic-modeling

我使用python中的gensim包为一些文本文件创建了一个LDA模型。我想获得学习模型的主题分布。在gensim ldamodel类中是否存在从模型中获取主题分布的方法或解决方案？例如，我使用一致性模型来寻找一个模型，该模型的值与1到5的主题数有关。得到最佳模型后，我使用get_document_topics方法(感谢)来获取用于创建该模型的文档中的主题分布。=

浏览 1提问于2018-08-29得票数 2

回答已采纳

1回答

使用LDA主题模型作为分类模型输入

python、lda、topic-modeling

我使用大的训练数据集制作LDA模型来制作主题模型。因此，我尝试使用这个LDA模型来对训练数据集中没有使用的新句子进行分类。欢迎使用Python分享示例代码。

浏览 4提问于2019-12-05得票数 0

1回答

使用Gensim或其他python LDA包来使用来自Mallet的经过训练的LDA模型

gensim、lda、mallet

我有一个在Java中通过Mallet训练的LDA模型。从Mallet LDA模型生成了三个文件，这允许我从文件运行模型并推断新文本的主题分布。现在，我想实现一个Python工具，它能够根据经过训练的LDA模型，在给定新文本的情况下推断主题分布。我不想在Python中重新训练LDA模型。因此，我想知道是否可以将经过训练的Mallet LDA模型加载到Gensim或任

浏览 18提问于2017-05-04得票数 5

2回答

具有潜在Dirichlet分配的子主题

python、nlp、lda、gensim

我正在用gensim的LdaMulticore训练LDA模型。这些主题看起来很棒，但是知道我知道的领域，在主题中有一些主题，但我不太确定如何最好的方法来建模。我遇到了分层LDA的这实现，但我很难实现它(没有社区支持)。我不认为gensim的hdpModel是我想要的，考虑到这的讨论。我现在正在做这个：2)使用这个LDA模型为每个记录分配一个主<e

浏览 0提问于2018-02-01得票数 2

2回答

LDA gensim实现，两个不同文档之间的距离

python、probability、gensim

为什么我对每个主题都得到相同的概率？一般来说，基于gensim中的主题模型提取来比较两个twitter用户的最佳方式是什么？= lda[corpus_tfidf] for item in c

浏览 0提问于2014-06-26得票数 5

1回答

LDA直觉

machine-learning、nlp、unsupervised-learning、topic-model、lda

有人能解释LDA-主题模型是如何将单词分配给主题的吗？我理解LDA模型的生成特性，但是该模型如何认识到“拉布拉多”和“狗”是相似的词/在同一个集群/主题中？有一种相似性度量吗？LDA的学习参数是:主题词的分配、主题词的概率向量和文档主题概率向量。但它是如何学会的呢？

浏览 0提问于2020-05-03得票数 1

回答已采纳

1回答

在SciKit学习或Gensim (Python3)中调整LDA超参数？

python、scikit-learn、nlp、gensim、hyperparameters

我正在尝试Gensim和SciKit learn (Python3)中的主题建模，我想了解更多关于在这两个包中调整超参数的信息。我在GITHUB上找到了一些相关的讨论，例如"optimize hyperparameters as part of LDA training"，但没有完整的文档。

浏览 31提问于2021-01-20得票数 0

1回答

使用LDA进行主题建模

python、deep-learning、nlp

通过定义主题来定义语料库和字典以构建LDA模型时，如何区分主题关键字它在给出一个明确的主题编号的同时工作，但我希望它被迭代。dictionary = corpora.Dictionary(doc_clean) corpus = [dictionary.doc2bow(doc) for doc in doc_clean] 构建LDA模型 lda_model = gensim.models.ldamodel.LdaModel(corpus = corp

浏览 6提问于2019-06-17得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云