腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3837)
视频
沙龙
1
回答
调
优
LDA
主题
模型
gensim
、
lda
、
topic-modeling
假设我使用gensim或sklearn构建了一个
LDA
主题
模型
,并为每个文档分配了热门
主题
。但有些文档与指定的热门
主题
不匹配。除了尝试不同数量的
主题
或使用连贯性分数来获得最佳
主题
数量之外,我还可以使用哪些其他技巧来改进我的
模型
?
浏览 37
提问于2021-02-09
得票数 0
1
回答
如何将预训练结束的
LDA
模型
传递给Gensim for DTM中的ldaseq?
gensim
、
lda
、
topic-modeling
我有一个
调
优
和预训练结束的
LDA
模型
,我想把它传递到gensim中的ldaseq
模型
,但是不知道如何实现它。我尝试过
lda
_model和sstats,但是它似乎不起作用,我仍然从日志记录中得到了这样的结果: 运行在线(多通)
LDA
培训,10个
主题
,10个通过所提供的1699文档的语料库,每1699个文档更新一次
模型
浏览 4
提问于2021-06-16
得票数 0
回答已采纳
1
回答
如何创建网格搜索来找到最佳参数?
r
、
topicmodels
在
lda
分析中 # parameters for Gibbs sampling iter <- 2000topicslibrary(topicmodels) ldaOut <-
LDA
(Associate
浏览 31
提问于2019-08-18
得票数 1
回答已采纳
2
回答
运行不带参数的插入符号方法
r
、
r-caret
我正在尝试运行一个不需要参数的插入符号方法,比如
lda
,下面的例子使用了"lvq“,它需要两个参数(size和k)。., data=iris, method="
lda
", trControl=control, tuneGrid=NULL)print(model) plot
浏览 3
提问于2017-04-06
得票数 1
2
回答
使用
主题
建模或另一种NLP方法,是否有可能为定义得更好的
主题
模型
定义属于
主题
/类别的单词?
python
、
python-3.x
、
nlp
、
lda
、
topic-modeling
在使用
主题
建模和考虑
LDA
& LSA方法时,我遇到了一个问题,然而,我发现有些
主题
并没有像我喜欢的那样被精确地定义。是否有可能将单词定义为
主题
,以帮助机器更好更容易地学习?如前所述,我尝试了
LDA
和LSA技术来进行
主题
建模,发现
LDA
是最准确的,其一致性评分为0.46,并重新定义了
主题
名称。但是,
主题
中的单词并不反映
主题
名称,这需要对
模型
进行
调
优
。技术
浏览 8
提问于2022-03-31
得票数 1
回答已采纳
1
回答
星火CrossValidator如何确定如何应用网格参数
scala
、
apache-spark
、
apache-spark-mllib
ML Tuning 的火花文档中的以下片段显然为Hashing TermFrequency设置了numFeatures,为LogisticRegression
模型
设置了regParam (正则化): HashingTF一个具体的例子:对于LDAModel:我们有
调
优
参数k、vocabSize和docConcentration:应该如何为这些参数设置ParamGrid?
浏览 0
提问于2017-12-07
得票数 1
回答已采纳
1
回答
如何提高sci学习中潜在dirichlet分配(
LDA
)的性能?
python
、
scikit-learn
、
tf-idf
、
lda
、
topic-modeling
我正在运行与健康相关的数据的
LDA
。具体来说,我有大约500份文件,其中包含了5-7页左右的访谈内容。然而,研究结果突出了两个问题: 1)不清楚
主题
是什么,因为每个
主题
中的词语不一定是一起或讲述一个故事;2)不同
主题
中的许多词语相互重叠,并且在大多数
主题
中出现了几个单词。我试了tf-以色列国防军和袋字(计数矢量),但我发现tf-国防军提供了稍微清晰和更明确的
主题
,同时分析了
LDA
输出。完成之后,我运行了一个
LDA
模型
。我将
主题
浏览 0
提问于2018-06-10
得票数 2
3
回答
如何提高随机森林多类分类
模型
的精度?
python
、
machine-learning
、
random-forest
我曾尝试下列方法,但未能达到50%以上的准确度: 我的类是不平衡的,所以我也尝试使用class_weight = balanced,过度采样使用SMOTE,下采样和重采样
浏览 0
提问于2018-12-05
得票数 2
回答已采纳
1
回答
如何寻找
lda
的最佳措施
r
、
quanteda
使用实现quanteda包的
lda
require(quanteda.corpora)require(topicmodels)) dtm <- convert(dfmat_news, to = "topicmodels")是否有任何指标可以帮助理解适当数量的
主题</e
浏览 0
提问于2019-08-12
得票数 0
回答已采纳
1
回答
卡雷特:尝试预测,但预测行不同
r
、
machine-learning
、
r-caret
我已经创建和
调
优
了多个
模型
,但当我试图预测它们时,我遇到了一些问题。我首先运行我的代码,如下所示,以优化一个
LDA
模型
。classProbs = TRUE,
lda
_tune这是有问题的,因为我用来自多个
模型
的预测值创建测试结果的data.frame,以便使用混淆矩阵进行分析。例如,当我运行这个 r
浏览 4
提问于2015-08-15
得票数 1
回答已采纳
3
回答
主题
发现/发现的最佳
模型
nlp
、
keyword
、
information-retrieval
、
information-extraction
、
topic-modeling
在简短的非结构化文档中发现
主题
的最佳
模型
是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
文本处理,如何使用
LDA
分配一个
主题
-> 1文档?
machine-learning
、
nlp
、
topic-modeling
、
text-classification
、
gensim
我有两个文件,我想从上面抽取两个
主题
(Music,Science)
lda
= gensim.models.ldamodel.LdaModel(corpus=my_corpus, id2word=corpus_dictionary, num_topics=2) print(
lda
.print_topicnot +
浏览 5
提问于2015-04-12
得票数 1
3
回答
从gensim
LDA
模型
中提取
主题
分布
gensim
、
lda
、
topic-modeling
我使用python中的gensim包为一些文本文件创建了一个
LDA
模型
。我想获得学习
模型
的
主题
分布。在gensim ldamodel类中是否存在从
模型
中获取
主题
分布的方法或解决方案?例如,我使用一致性
模型
来寻找一个
模型
,该
模型
的值与1到5的
主题
数有关。得到最佳
模型
后,我使用get_document_topics方法(感谢)来获取用于创建该
模型
的文档中的
主题
分布。=
浏览 1
提问于2018-08-29
得票数 2
回答已采纳
1
回答
使用
LDA
主题
模型
作为分类
模型
输入
python
、
lda
、
topic-modeling
我使用大的训练数据集制作
LDA
模型
来制作
主题
模型
。因此,我尝试使用这个
LDA
模型
来对训练数据集中没有使用的新句子进行分类。欢迎使用Python分享示例代码。
浏览 4
提问于2019-12-05
得票数 0
1
回答
使用Gensim或其他python
LDA
包来使用来自Mallet的经过训练的
LDA
模型
gensim
、
lda
、
mallet
我有一个在Java中通过Mallet训练的
LDA
模型
。从Mallet
LDA
模型
生成了三个文件,这允许我从文件运行
模型
并推断新文本的
主题
分布。现在,我想实现一个Python工具,它能够根据经过训练的
LDA
模型
,在给定新文本的情况下推断
主题
分布。我不想在Python中重新训练
LDA
模型
。因此,我想知道是否可以将经过训练的Mallet
LDA
模型
加载到Gensim或任
浏览 18
提问于2017-05-04
得票数 5
2
回答
具有潜在Dirichlet分配的子
主题
python
、
nlp
、
lda
、
gensim
我正在用gensim的LdaMulticore训练
LDA
模型
。这些
主题
看起来很棒,但是知道我知道的领域,在
主题
中有一些
主题
,但我不太确定如何最好的方法来建模。我遇到了分层
LDA
的这实现,但我很难实现它(没有社区支持)。我不认为gensim的hdpModel是我想要的,考虑到这的讨论。我现在正在做这个:2)使用这个
LDA
模型
为每个记录分配一个主<e
浏览 0
提问于2018-02-01
得票数 2
2
回答
LDA
gensim实现,两个不同文档之间的距离
python
、
probability
、
gensim
为什么我对每个
主题
都得到相同的概率?一般来说,基于gensim中的
主题
模型
提取来比较两个twitter用户的最佳方式是什么?=
lda
[corpus_tfidf] for item in c
浏览 0
提问于2014-06-26
得票数 5
1
回答
LDA
直觉
machine-learning
、
nlp
、
unsupervised-learning
、
topic-model
、
lda
有人能解释
LDA
-
主题
模型
是如何将单词分配给
主题
的吗?我理解
LDA
模型
的生成特性,但是该
模型
如何认识到“拉布拉多”和“狗”是相似的词/在同一个集群/
主题
中?有一种相似性度量吗?
LDA
的学习参数是:
主题
词的分配、
主题
词的概率向量和文档
主题
概率向量。但它是如何学会的呢?
浏览 0
提问于2020-05-03
得票数 1
回答已采纳
1
回答
在SciKit学习或Gensim (Python3)中调整
LDA
超参数?
python
、
scikit-learn
、
nlp
、
gensim
、
hyperparameters
我正在尝试Gensim和SciKit learn (Python3)中的
主题
建模,我想了解更多关于在这两个包中调整超参数的信息。我在GITHUB上找到了一些相关的讨论,例如"optimize hyperparameters as part of
LDA
training",但没有完整的文档。
浏览 31
提问于2021-01-20
得票数 0
1
回答
使用
LDA
进行
主题
建模
python
、
deep-learning
、
nlp
通过定义
主题
来定义语料库和字典以构建
LDA
模型
时,如何区分
主题
关键字 它在给出一个明确的
主题
编号的同时工作,但我希望它被迭代。dictionary = corpora.Dictionary(doc_clean) corpus = [dictionary.doc2bow(doc) for doc in doc_clean] 构建
LDA
模型
lda
_model = gensim.models.ldamodel.LdaModel(corpus = corp
浏览 6
提问于2019-06-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
技术干货:一文详解LDA主题模型
模型调优没效果?不妨试试Batch Normalization!
使用Optuna进行PyTorch模型的超参数调优
值得买:正在训练和调优公司消费大模型
在构建机器学习模型的时候,如何进行超参数调优?
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券