腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
gensim
LDA
中
,
有没有
一种
方法
可以
构建
一个
文档
明智
的
方法来
衡量
一个
主题
是否
适合
它
、
例如,如果
主题
A具有以下分布:单词A: 0.6,单词B: 0.3,单词C: 0.1。基于
文档
中
包含单词C
的
事实,该
文档
已被归类为
主题
A。
它
没有其他单词(既不是来自
主题
A,也不是来自任何其他
主题
)。
有没有
什么指标告诉你,即使它被分配了
主题
A,它也是
一个
弱分配
浏览 56
提问于2021-03-22
得票数 0
1
回答
在
Python中使用
Gensim
进行
主题
建模
、
、
、
、
我有两节课
的
单词清单。假设n项
在
A类
中
,m项
在
类B
中
。我希望
在
python中使用
gensim
包(用于
LDA
)
的
主题
建模,以便为A类和B类训练
一个
模型,同时我对
主题
建模和Python都很陌生。我
的
意思是,我应该把每个班级
的
所有包和使用
的
gensim
合并起来,还是应该单独使用每个项目的包?谢谢!
浏览 3
提问于2014-12-05
得票数 1
回答已采纳
1
回答
Gensim
获取
文档
的
主题
(见
文档
)
、
、
我知道,在对
gensim
的
lda
模型进行培训之后,我们
可以
通过以下
方法
获得
一个
看不见
的
文档
的
主题
:doc_
lda
=
lda
[doc_bow] 但是,那些已经用于培训
的
文档
呢?我
的
意思是,
是否
有
一种
浏览 3
提问于2014-04-12
得票数 8
回答已采纳
3
回答
如何在
gensim
中
获取
LDA
模型
中
的
主题
编号
、
、
、
我已经
在
text_corpus上使用
gensim
训练了
LDA
模型。>
lda
_model =
gensim
.models.ldamodel.LdaModel(text_corpus, 10) 现在,如果必须推断
一个
新
的
文本
文档
text_sparse_vector,我必须这样做类
gensim
.models.ldamodel.LdaModel具有名为show_topics(topics=10,topn=10,log=False,for
浏览 3
提问于2012-12-17
得票数 1
1
回答
如何使用
主题
模型(
LDA
)输出来匹配和检索新
的
、相同
主题
的
文档
、
、
我
在
语料库上使用
一个
LDA
模型来学习它所涵盖
的
主题
。我正在使用
gensim
包(例如,
gensim
.models.ldamodel.LdaModel);如果需要,
可以
很容易地使用其他版本
的
LDA
。我
的
问题是,使用参数化模型和/或
主题
词或
主题
is查找和检索包含
主题
的
新
文档
的
最有效
浏览 5
提问于2016-10-25
得票数 0
回答已采纳
1
回答
标签
的
LDA
(
gensim
)
、
、
我使用
Gensim
包进行
主题
建模。这个想法是为了理解flickr标签
中
的
主题
是什么。到目前为止,我使用
的
是这个代码(
文档
是标签): texts = [[word for word in document.split(";") if word not in stoplist] for
LDA
,然后为每个
主题
打印最可能
的
10个单词。这是正确
的
吗?或者,我
是否
必
浏览 3
提问于2016-03-04
得票数 2
1
回答
如何在
gensim
中使用models.hdpmodel - Hierarchical Dirichlet过程获取
文档
主题
、
、
、
、
我只是为了
主题
建模而学习
gensim
。当我使用
lda
_model =
gensim
.models.ldamodel.LdaModel(...)结果
lda
_model有两个函数: get_topics()和get_document_topics()。我
可以
通过它们找到
主题
-word和
文档
-
主题
。但是,我想尝试一下: hdp_
lda
_model =
gensim
.models.hdpmodel.Hdp
浏览 108
提问于2019-12-20
得票数 1
回答已采纳
1
回答
使用
gensim
进行词聚类
、
、
、
、
我刚接触
gensim
,我读过关于
的
文章,据我所知,
它
创建了
一个
带有
主题
和单词
的
模型,并试图将它们联系起来。
在
我
的
公司,我们有
一个
短语列表,我们使用
一个
使用Damerau-Levenshtein距离公式
的
脚本对它们进行过滤后手动对它们进行聚类(实际上,这个数据是
在
Elasticsearch上
的
,我们使用fuzzyness我
的
问题是:这个
ge
浏览 0
提问于2017-05-18
得票数 1
1
回答
在
自然语言中比较几个语料库
的
最佳
方法
是什么?
、
、
、
、
我一直在为
一个
研究项目(使用
Gensim
和python)用自然语言编写叙事报告
的
LDA
主题
模型。我有几个较小
的
语料库(每个语料库从1400到200个
文档
-我知道,这很小!)我想进行比较,但除了查看每个
LDA
模型(例如使用pyLDAviz)之外,我不知道如何进行比较。我
的
学术背景不是CS,而且我对NLP还是个新手。
在
语料库/
主题
模型中比较
主题
的
一些好<e
浏览 0
提问于2017-09-01
得票数 4
1
回答
基于
Gensim
的
多个语料库
的
潜在Dirichlet分配
、
、
、
我有两个与
gensim
的
使用有关
的
问题。 1)如何使用
一个
语料库创建
一个
模型,保存
它
,或者通过
在
另
一个
语料库上对模型进行训练来扩展
它
?有可能吗?( 2)
LDA
是否
可以
用来分类
一个
看不见
的
文档
,或者需要通过将它包含在语料库
中
来重新创建模型?
有没有
一种
在线
的
方
浏览 1
提问于2015-05-31
得票数 0
回答已采纳
1
回答
如何从原语料库
中
包含最大句子
的
句子语料库
中
求出最小
的
句子?
、
、
、
、
我有
一个
“优化”问题,我真的不知道我应该从哪
一个
方向出发。下面是对我问题
的
描述:语料库: 包含原始语料库最大值
浏览 1
提问于2017-02-16
得票数 0
回答已采纳
3
回答
使用从潜在Dirichlet分配派生
的
主题
对
文档
进行聚类
、
、
我想对
一个
项目使用潜在
的
Dirichlet分配,我正在使用Python和
gensim
库。
在
找到
主题
之后,我希望使用k-
方法
这样
的
算法对
文档
进行聚类(理想情况下,我希望对重叠
的
集群使用
一个
很好
的
方法
,因此欢迎任何建议)。我设法得到了这些
主题
,但它们
的
形式如下: 0.041*部长+0.041*关键+0.041*瞬间+0.041*有争议
的</e
浏览 0
提问于2014-11-13
得票数 9
1
回答
如何测试文本聚类应用程序?
、
、
我正在开发
一个
根据
主题
对
文档
进行集群
的
应用程序。我使用
LDA
(潜在
的
Dirichlet分配)算法。现在原型已经准备好了,也有了一些结果。
一个
主题
内
的
文件确实是关于这个
主题</em
浏览 2
提问于2014-01-10
得票数 0
1
回答
是否
有
一种
方法
可以
从
gensim
LDA
预先训练
的
模型
中
推断出在看不见
的
文档
上
的
主题
分布?
、
、
是否
有
一种
方法
可以
在
不使用
LDA
_ModelunseenDoc语法
的
情况下使用经过预先训练
的
LDA
模型来获得未见
文档
的
主题
分布?我正在尝试将我
的
LDA
模型实现到
一个
web应用程序
中
,如果有
一种
方法
可以
使用矩阵乘法来获得类似的结果,那么我
可以
浏览 6
提问于2020-06-04
得票数 0
回答已采纳
1
回答
Gensim
主题
建模,并提供建议
的
初步投入?
、
、
我正在使用python
中
的
gensim
在
一个
中等大小
的
语料库上做am
主题
模型。我们已经大致知道了一些我们期待的话题。特别是,我们知道语料库
中
确实存在
一个
特定
的
主题
,我们希望模型能够为我们找到这个
主题
,这样我们就
可以
提取出属于这个
主题
的
语料库
的
元素。
有没有
一种
方法</e
浏览 8
提问于2022-10-31
得票数 -1
1
回答
在
R
的
潜在狄利克雷分配(
LDA
)
中
,
一个
特定
主题
的
项
的
概率是多少
、
、
、
我
在
R
中
工作,打包“topicmodel”。我正在努力工作,更好地理解代码/包。
在
我正在阅读
的
大多数教程和
文档
中
,我看到人们通过5个或10个最可能
的
术语来定义
主题
。
在
lda
对象
中
,我
可以
访问gamma元素,
它
包含每个
文档
涉及每个
主题
的
可能性。因此,基于此,我
可以
提取概率大于任何我喜欢
浏览 4
提问于2017-05-15
得票数 3
3
回答
对于动态
主题
模型,
有没有
高效
的
python库,最好是扩展
Gensim
?
、
、
、
、
我正在尝试使用
主题
模型对twitter流数据进行建模。
Gensim
是
一个
易于使用
的
解决方案,
它
的
简单性令人印象深刻。它有
一个
真正
的
LSI在线实现,但不是
LDA
。对于像twitter这样不断变化
的
内容流,动态
主题
模型是理想
的
选择。
有没有
什么
方法
,或者甚至是黑客--
一种
实现,或者甚至是
一种
策略,我
可以</e
浏览 2
提问于2014-03-18
得票数 6
1
回答
语料库
的
整体
主题
分布,而不是单个
文档
、
、
、
、
我正在使用
gensim
LDA
进行
主题
建模。我需要获取语料库
的
主题
分布,而不是单个
文档
的
主题
分布。假设我有1000个
文档
,属于10个不同
的
类别(假设每个类别有100个
文档
)。
在
训练了1000个
文档
的
LDA
模型之后,我想看看每个类别的主要
主题
是什么。下图说明了我
的
数据集和目标。 到目前为
浏览 22
提问于2018-10-19
得票数 0
2
回答
在
LDA
中指定词汇表输入
、
、
、
、
我正在尝试理解如何在我
的
案例中使用
LDA
。我有
一个
包含许多
文档
的
语料库,我想看看一组非常具体
的
单词和ngram是如何跨
主题
分布
的
。
有没有
一种
方法
可以
指定特定单词
的
列表作为
主题
建模
的
词汇表?我一直
在
使用
gensim
实现,我相信参数id2word
可以
处理这个问题,但是
文档
浏览 12
提问于2020-02-18
得票数 0
2
回答
有必要将TF-IDF应用于
gensim
LDA
模型
中
的
新
文档
吗?
我在上关注“英语维基百科”
的
基因教程doc_
lda
=
lda
[doc_bow]
LDA
是否
只需要词袋向量?
浏览 89
提问于2017-06-27
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Gensim,一个主题建模与文档相似度的Python库!
有了这5个工具可以满足你对NLP的“一切”需求!
Spark平台下基于LDA的k-means算法实现
当特朗普口中的“Fake News”遇上自然语义处理……
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券