腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
在
使用
gensim
计算
LDA
的
一致性
分数
时
速度
如此
之慢
nlp
、
gensim
、
lda
我是新手,当我
使用
gensim
CoherenceModel为我
的
LDA
模型
计算
一致性
分数
时
,它需要非常长
的
时间才能运行。然而,训练部分相对较快,并且
在
合理
的
时间内。我想知道这是不是因为我
的
数据大小(大约250000长文本),有什么方法可以加速这个过程?谢谢 这是我
的
代码,与教程中
的
代码完全相同 from
gensim
.mode
浏览 342
提问于2019-06-22
得票数 1
2
回答
Gensim
LDA
一致性
评分南
python
、
machine-learning
、
gensim
、
lda
、
topic-modeling
我创建了一个
Gensim
LDA
模型,如本教程所示:它生成10个主题,log_perplexity为:
lda
_model.log_perplexity(data_df‘’bow_
浏览 0
提问于2020-02-16
得票数 8
回答已采纳
2
回答
基于Mallet困惑
的
Gensim
主题建模
python
、
gensim
、
topic-modeling
、
mallet
、
perplexity
我是主题模特儿哈佛图书馆
的
书名和主题。p
浏览 5
提问于2019-03-21
得票数 1
1
回答
为什么
gensim
LdaMulticore
在
不同
的
机器上产生不同
的
结果?
python
、
multithreading
、
nlp
、
gensim
、
lda
为什么
gensim
Lda
多核
在
不同
的
机器上产生不同
的
结果? 如何在不同
的
机器/机器上校准LdaMulticore参数?这就是我
为什么
要问:我
在
2台不同
的
机器上运行
gensim
(Windows;
gensim
3.8.3和Linux集群;
gensim
4.1.2)。( a)对A机(Windows X11 Yoga - coherence,困惑减少)返回了
浏览 9
提问于2022-08-12
得票数 0
3
回答
从
gensim
LDA
模型中提取主题分布
gensim
、
lda
、
topic-modeling
我
使用
python中
的
gensim
包为一些文本文件创建了一个
LDA
模型。我想获得学习模型
的
主题分布。
在
gensim
ldamodel类中是否存在从模型中获取主题分布
的
方法或解决方案?例如,我
使用
一致性
模型来寻找一个模型,该模型
的
值与1到5
的
主题数有关。得到最佳模型后,我
使用
get_document_topics方法(感谢)来获取用于创建该模型
的
文
浏览 1
提问于2018-08-29
得票数 2
回答已采纳
1
回答
Gensim
LDA
:两次运行之间
的
一致性
值不可重复
gensim
、
lda
我
使用
这段代码来查找数据集
的
主题
一致性
。当我
使用
相同数量
的
主题尝试这段代码
时
,每次运行后都会得到新
的
值。例如,对于主题数=10,在运行2之后,我得到了以下值:
一致性
评分UMASS_1:-3.3065236823786064第二次运行主题数=10个
一致性
得分CV_2: 0.277016662550274
浏览 1
提问于2018-08-21
得票数 1
4
回答
每次我
在
同一个语料库上训练
时
,
LDA
模型都会产生不同
的
主题。
python
、
nlp
、
lda
、
topic-modeling
、
gensim
我
使用
python
gensim
从231个句子
的
小语料库中训练一个潜在
的
Dirichlet分配(
LDA
)模型。然而,每次我重复这个过程,都会产生不同
的
主题。
为什么
每次都
使用
相同
的
LDA
参数和语料库生成不同
的
主题?from
gensim
import corpor
浏览 4
提问于2013-02-25
得票数 18
回答已采纳
1
回答
2没有这样
的
文件或目录
nlp
、
gensim
、
lda
、
mallet
(mallet_path, corpus=corpus, id2word=id2word, 然后
使用
save方法保存模型:
在
培训模式
时
,我忘记了将前缀设置为某个文件,因此,
在
培训
时
,我丢失了
gensim
创建
的
所有临时文件(doctopics等)。正因为
如此
,当我加载模型并想预测主题
时
: model_<
浏览 4
提问于2020-03-09
得票数 0
3
回答
Gensim
:如何从保存
的
lda
模型加载语料库?
gensim
、
lda
、
corpus
当我保存我
的
LdaModel
lda
_model.save('model')
时
,它保存了4个文件:
lda
_model = LdaModel.load('model') dict = corpora.Dictionary.load('mod
浏览 6
提问于2020-03-24
得票数 1
回答已采纳
1
回答
ghci是不是超级慢?
haskell
在
我
使用
n=10000
的
计算
机上,以下用于查找低于给定限制
的
所有完全数
的
Haskell程序
在
ghci中执行大约5-10秒:
为什么
执行
速度
<e
浏览 0
提问于2021-05-25
得票数 0
2
回答
有必要将TF-IDF应用于
gensim
LDA
模型中
的
新文档吗?
gensim
我在上关注“英语维基百科”
的
基因教程doc_
lda
=
lda
[doc_bow]
LDA
是否只需要词袋向量?
浏览 89
提问于2017-06-27
得票数 10
回答已采纳
1
回答
运行时错误:尝试
在
python简单
LDA
实现中完成当前进程之前启动新进程。
python
、
process
、
runtime-error
、
large-data
、
latentdirichletallocation
我尝试
使用
简单
的
LDA
和LDAMulticore
在
一个非常大
的
数据集中运行潜在
的
Dirichlet分配。但是
在
执行两天后得到以下错误“尝试在当前进程完成其引导阶段之前启动一个新进程。from
gensim
.models.coherencemodel import CoherenceModel
Lda
=
gensim
.models.ldamodel.LdaMod
浏览 8
提问于2022-08-06
得票数 0
1
回答
标签
的
LDA
(
gensim
)
python
、
lda
、
gensim
我
使用
Gensim
包进行主题建模。这个想法是为了理解flickr标签中
的
主题是什么。到目前为止,我
使用
的
是这个代码(文档是标签): corpus = [dictionary.doc2bow(text) for text in texts]
浏览 3
提问于2016-03-04
得票数 2
3
回答
如何修正
LDA
模型
一致性
评分运行时错误?
python
、
nlp
、
runtime-error
、
lda
、
topic-modeling
‘id2word = corpora.Dictionary(data_lemmatized)corpus = [id2word.doc2bow(text) for text in texts] doc_
lda
=
lda</em
浏览 19
提问于2020-05-17
得票数 2
回答已采纳
2
回答
一致性
评分(u_mass) -18是好还是坏?
nlp
、
lda
、
topic-modeling
、
lsa
、
topicmodels
我读了这个问题(),发现
一致性
分数
( u_mass )从-14分到14分。但是当我做实验
时
,我得到了一个
分数
-18分( u_mass )和0.67分( c_v )。我想知道
为什么
我
的
u_mass
分数
超出了范围(-14,14)? 更新:我
使用
gensim
库并扫描了2到50个主题
的
数量。对于u_mass来说,它从0开始到最低
的
负值,然后稍微回过头来,就像c_v
的
朝下版本一样。
浏览 26
提问于2020-05-26
得票数 3
回答已采纳
3
回答
为什么
存储引用而不是请求两次引用会让我
的
应用程序变得
如此
慢?
c++
对象memory有一个带有签名
的
方法我在下面的for循环中
使用
了它: const BinaryPattern s = memory->getPattern(k);}for (unsigned int k = 0;
浏览 1
提问于2012-08-15
得票数 1
回答已采纳
2
回答
Gensim
LDA
alpha参数
gensim
、
lda
我
在
gensim
的
lda
实现中尝试了alpha
的
三个默认选项,现在想知道结果:所有文档
的
主题概率之和小于语料库中
的
文档数量(见下文)。例如,alpha =‘对称’产生大约9357作为主题概率
的
总和,然而,主题
的
数量是9459。能告诉我这个意外结果
的
原因吗?
浏览 0
提问于2017-02-22
得票数 1
2
回答
LDA
gensim
实现,两个不同文档之间
的
距离
python
、
probability
、
gensim
编辑:我在这里发现了一个有趣
的
问题。表明,
gensim
在
训练和推理步骤中都
使用
随机性。因此,这里建议设置一个固定
的
种子,以便每次都能获得相同
的
结果。
为什么
我对每个主题都得到相同
的
概率?有没有可能为
gensim
中
的
每个用户
计算
相同
的
主题,或者我必须
计算
主题字典并对每个用户主题进行聚类? 一般来说,基于
gensim
中
的
主题模型提取来
浏览 0
提问于2014-06-26
得票数 5
1
回答
IndexError
在
更新
gensim
的
LdaModel
时
python-3.x
、
gensim
、
lda
、
topic-modeling
、
index-error
在
更新
gensim
的
时
,我面临以下错误: 因为我有一个很大
的
数据集,所以我正在逐块地加载它(
使用
pickle.load)。chunk_no = 0while 1:
浏览 2
提问于2018-05-07
得票数 3
回答已采纳
1
回答
使用
pyspark.ml从
LDA
模型中获取推荐
的
主题数
python
、
apache-spark
、
pyspark
、
nlp
、
databricks
我训练了一个
LDA
模型,它
使用
pyspark对文本进行主题分类,尝试不同
的
K值。但是,要验证所选
的
K,,我需要
使用
这个aproach ,但是,对于spark.ml,,我不知道如何获得等效
的
gensim
CoherenceModel。为例,以 (
计算
模型困惑与
一致性
评分和超参数整定)为例,由于数据
的
大小,它是不可行
的
。
在
长时间执行之后,我得到了以下错误: Internal error
浏览 0
提问于2020-09-19
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10大Python与机器学习开源项目!第一居然不是它!
有了这5个工具可以满足你对NLP的“一切”需求!
周末AI课堂 理解词嵌入 代码篇 机器学习你会遇到的“坑”
Spark平台下基于LDA的k-means算法实现
区块链服务平台在跨境交易中领先
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券