腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用Gensim或其他python
LDA
包来使用来自Mallet的经过训练的
LDA
模型
、
、
我有一个在
Java
中通过Mallet训练的
LDA
模型
。从Mallet
LDA
模型
生成了三个文件,这允许我从文件运行
模型
并推断新文本的主题分布。现在,我想实现一个Python工具,它能够根据经过训练的
LDA
模型
,在给定新文本的情况下推断主题分布。我不想在Python中重新训练
LDA
模型
。因此,我想知道是否可以将经过训练的Mallet
LDA
模型
加载到Gensim或任何其他python
浏览 18
提问于2017-05-04
得票数 5
1
回答
"main“
java
.lang.ClassCastException:[Lscala.Tuple2;在Spark MLlib
LDA
中不能强制转换为scala.Tuple2
、
、
、
、
我正在使用Spark 1.3.0 (Scala2.10.X) MLlib
LDA
算法和Spark
Java
API。当我试图在运行时从
LDA
模型
中读取文档主题分布时,我遇到了以下问题。"main“
java
.lang.ClassCastException:[Lscala.Tuple2;不能强制转换为scala.Tuple2DistributedLDAModelldaModel = new
LDA
().setK(3).run(corpus); RDD&
浏览 0
提问于2015-07-29
得票数 1
1
回答
将gensim
LDA
模型
保存到s3
、
、
我已经通过使用gensim得到了一个
LDA
模型
。我可以将其保存在本地:这将在指定位置生成四个文件:
lda
.model.expElogbeta.npy') 但是,我希望将此
模型
保存在s3上。,这样它们才能像预期的那样作为一个连贯的
模型
发挥作用。所以我的想法是,除了我之外,其他人可以从s3中获取这些文件,并将
浏览 12
提问于2020-05-06
得票数 0
回答已采纳
3
回答
从Pyspark
模型
中提取文档主题矩阵
、
、
、
我已经通过Python成功地训练了spark中的
LDA
模型
:model=
LDA
.train(corpus,k=10)这很好,但我现在需要
LDA
模型
的文档主题矩阵,但据我所知,我所能得到的只有单词-主题,使用model.topicsMatrix()。是否有办法从
LDA
模型
中获得文档主题矩阵,如果没有,是否有其他方法(除了从头开始实现
LDA
之外)来运行<e
浏览 2
提问于2015-10-12
得票数 16
回答已采纳
1
回答
如何在python中保存
LDA
模型
- LatentDirichletAllocation
、
、
我用下面的命令训练了一个
LDA
模型
,需要了解如何保存它。
lda
_model = LatentDirichletAllocation(n_components=25, random_state=100)AttributeError:“LatentDirichletAllocation”对象没有属性“保存”训练模特花了16个小时。
浏览 0
提问于2019-09-13
得票数 2
回答已采纳
1
回答
如何在R中保存主题
模型
并在不同的数据上运行它
、
我对主题
模型
还是个新手。我有两个文档语料库,想要比较相同主题在不同语料库中出现的频率。我在两个语料库的文档组合样本上运行了一个具有40个主题的主题
模型
。现在,我想保存
模型
并为两个语料库分别运行它。control_
LDA
_VEM <-+ verbose
浏览 0
提问于2018-05-06
得票数 0
1
回答
LDA
在Galago搜索引擎中的应用
、
、
我希望使用
LDA
对某些文档进行聚类(最初使用任何
模型
检索文档)。我更喜欢使用基于
java
的实现,它可以使用Galago集成到我的代码中。如果您能让我知道
LDA
的开放源码实现更适合我的目的,我将不胜感激。 提前感谢您的帮助!
浏览 2
提问于2016-04-28
得票数 2
回答已采纳
2
回答
预测函数在R中运行DFA时的误差
我的代码很简单:,data=data2.x, Cna.action="na.omit",CV=TRUE) data
浏览 5
提问于2015-09-05
得票数 0
回答已采纳
3
回答
主题发现/发现的最佳
模型
、
、
、
、
在简短的非结构化文档中发现主题的最佳
模型
是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
2
回答
LDA
gensim实现,两个不同文档之间的距离
、
、
一般来说,基于gensim中的主题
模型
提取来比较两个twitter用户的最佳方式是什么?=
lda
[corpus_tfidf] for item in corpus_
lda
: corpus_
lda
2 =
lda
[corpus_tfidf2] for it incorpus_
lda
浏览 0
提问于2014-06-26
得票数 5
1
回答
使用pyspark.ml从
LDA
模型
中获取推荐的主题数
、
、
、
、
我训练了一个
LDA
模型
,它使用pyspark对文本进行主题分类,尝试不同的K值。0000qatEJUAY| [bien]|+------------+--------------------+model =
lda
.fit(tfidfLaw)mo
浏览 0
提问于2020-09-19
得票数 3
1
回答
文本处理,如何使用
LDA
分配一个主题-> 1文档?
、
、
、
、
我有两个文件,我想从上面抽取两个主题(Music,Science)
lda
= gensim.models.ldamodel.LdaModel(corpus=my_corpus, id2word=corpus_dictionary, num_topics=2) print(
lda
.print_topic我想 使用music.tx
浏览 5
提问于2015-04-12
得票数 1
1
回答
无法在Spark中设置正确的内存选项
、
、
我正在对wikipedia文章(400万个文档,大约14 am数据)训练一个
LDA
模型
。我在一台内存为98 on的机器上运行scala脚本。executor-memory 2G --driver-memory 25G --total-executor-cores 10 --conf spark.driver.maxResultSize=50gval
lda
= new
LDA
().setOptimizer(new OnlineLDAOptimizer()).setK(numTopics).setMaxItera
浏览 3
提问于2016-07-01
得票数 2
1
回答
HTTP中的
LDA
gensim
模型
-内存问题
、
、
、
、
我成功地训练了一个
模型
(针对100个主题),然后我想在我用python烧瓶创建的HTTP中使用该
模型
。端点给出给定文本的返回项。tags = tags +
lda
.topic_words(topic_index, num_of_keywords_for_topic, model, words) File "/var/app/tagbee&
浏览 0
提问于2020-01-02
得票数 0
1
回答
主题建模-计算滑雪
LDA
模型
的一致性得分?
、
、
、
、
我尝试了几种方法来计算一个sklearn
模型
的一致性得分,但是它没有成功。什么是计算一个滑雪
LDA
模型
的一致性得分的方法?当我使用标准gensim代码计算一致性评分时,我会收到以下错误: ValueError:当前不支持此主题
模型
。受支持的主题
模型
应该实现get_topics方法。training_data_preprocessed['Input']) number_words = 5 # Create an
浏览 4
提问于2022-04-04
得票数 0
2
回答
如何使用gensim查看和解释
lda
模型
的输出
、
、
、
我可以创建
lda
模型
并保存它。现在,我正在尝试加载
模型
,并传递一个新文档在打印doc_
lda
时,我得到了对象。
浏览 5
提问于2017-04-11
得票数 2
3
回答
从gensim
LDA
模型
中提取主题分布
、
、
我使用python中的gensim包为一些文本文件创建了一个
LDA
模型
。我想获得学习
模型
的主题分布。在gensim ldamodel类中是否存在从
模型
中获取主题分布的方法或解决方案?例如,我使用一致性
模型
来寻找一个
模型
,该
模型
的值与1到5的主题数有关。得到最佳
模型
后,我使用get_document_topics方法(感谢)来获取用于创建该
模型
的文档中的主题分布。=
lda
_modelprint(b
浏览 1
提问于2018-08-29
得票数 2
回答已采纳
2
回答
基于潜在狄利克雷分配的文档聚类
、
在使用
LDA
算法识别所有文档的主题/聚类后,当新文档到达数据库时,我们是否需要重新运行整个过程,或者是否有其他方法可以通过
模型
直接将新文档映射到预定义的聚类/主题。
浏览 3
提问于2015-10-26
得票数 1
1
回答
基于Gensim的多个语料库的潜在Dirichlet分配
、
、
、
1)如何使用一个语料库创建一个
模型
,保存它,或者通过在另一个语料库上对
模型
进行训练来扩展它?有可能吗? ( 2)
LDA
是否可以用来分类一个看不见的文档,或者需要通过将它包含在语料库中来重新创建
模型
?我对
LDA
有相当基本的理解,并使用、
lda
、和gensim库对简单语料库进行主题建模。请指出问题中任何概念上的不一致之处。谢谢!
浏览 1
提问于2015-05-31
得票数 0
回答已采纳
1
回答
如何修复坏掉的类文件错误?
、
、
、
我已经安装了Scala2.12,
Java
1.8.0_111,sbt,如其中所述。现在当我运行:
java
-jar tmt-0.4.0.jar example-0-test.scalaerror: error while loading CharSequence, class file '/usr/lib/jvm/
java
-8-oracle/jre/lib/rt.jar(
java
/lang/CharS
浏览 1
提问于2016-11-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之LDA主题模型算法应用
技术干货:一文详解LDA主题模型
Java内存模型、JVM内存模型及Java对象模型-JAVA成长之路
Java内存模型
机器学习算法系列——LDA
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券