腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用LDA(
主题
模型):
每个
主题
对
单词
的
分布是相似和“扁平”
的
。
python
、
lda
、
topic-modeling
、
gensim
潜在Dirichlet分配(LDA)是一个寻找潜在变量(
主题
)隐藏在一堆文档中
的
主题
模型。我使用python包,有两个问题: 我为
每个
主题
打印了
最
频繁
的
单词
(我尝试了10,20,50个
主题
),发现
单词
上
的
分布非常“平坦”:意思是即使
最
频繁
的
单词
也只有1%
的
概率.大多数
主题
都是相似的:对于
每个</em
浏览 2
提问于2015-02-23
得票数 7
1
回答
获取
每个
主题
的
最
可能
单词
python
、
scikit-learn
、
lda
、
topic-modeling
我用sklearn做了一个LDA模型,但是,听起来很奇怪,我在网上找不到任何关于如何获得热门词汇
的
东西。这是我
的
代码: from sklearn.feature_extraction.text import CountVectorizer doc_term_matrixwords in topic_words.items(): print(' %s' % ', '.
浏览 16
提问于2021-01-03
得票数 1
回答已采纳
1
回答
NMF作为Python Scikit中
的
聚类方法
python
、
scikit-learn
、
nmf
在我
的
工作中,我使用Scikit NMF实现,但据我所知,在Scikit中,NMF更像是一种分类方法,而不是一种聚类方法。 我已经开发了一个简单
的
脚本,在一些示例弧线上工作。我正在对它们进行预处理,并将其作为NMF
的
输入。根据我
的
教授分享
的
论文,我收到了一些集群,但我不知道如何可视化/呈现它们。 你们中有谁知道如何让这本书读起来更人性化?
浏览 47
提问于2019-01-31
得票数 4
回答已采纳
1
回答
使用TextmineR包传递项共现矩阵
获取
每个
主题
的
文档加载
r
、
text-mining
、
word-embedding
我使用包查找与给定文档列表
最
相似的文档。calc_coherence = TRUE, cpus = 2) 现在,模型参数theta在这里生成
每个
主题
的
单词
加载,而不是
每个
主题
加载文档。我想从
每个
主题
的
文档加载中检索文档编号。请帮助建议从该模型中
获取
文档
每个
主
浏览 0
提问于2019-01-20
得票数 0
1
回答
从LDA
主题
建模中创建更多相关
的
结果?
nltk
、
gensim
、
lda
、
topic-modeling
、
word-cloud
我正在为我
的
学位做一个项目,我有一个来自另一所大学
的
实际客户。他们想让我对他给我
的
文件摘要
的
sql文件进行
主题
建模。我没有任何
主题
建模
的
经验,但我一直在使用Gensim和Nlkt在木星笔记本。他现在想要
的
是让我生成10个或更多
的
主题
,记录LDA结果中最常见
的
前10个
单词
,然后如果它们在
每个
主题
中非常频繁,那么将它们从产生
的
<em
浏览 2
提问于2022-02-27
得票数 0
2
回答
结构化文档中
的
主题
模型?(或者EM或MCMC可以工作吗?)
statistics
、
probability
、
bayesian
、
montecarlo
、
topic-modeling
我有一组文档,
每个
文档由N个
单词
组成。
每个
文档
的
第i个
单词
选自共同
的
单词
集合Wi={wi1,wi2,wi3,wi4}。例如,
每个
文档中
的
第一个
单词
可能
选自:{'alpha','one',' first ',‘For’}。第二个
单词
可能
选自:{'beta','two'
浏览 4
提问于2014-01-24
得票数 2
1
回答
主题
建模错误值太多,无法解包
python
、
dataframe
、
dataset
、
data-science
、
topic-modeling
我正在尝试使用tsne和pyldavis作为可视化工具来执行lda
主题
建模。然而,在
获取
主要
主题
的
同时执行lda之后,会给出错误,因为有太多
的
值需要解包。代码和错误如下所示。任何帮助都是非常感谢
的
。 LdaMulticore
主题
建模代码: import sys
浏览 18
提问于2020-09-11
得票数 0
回答已采纳
1
回答
在实现了文本文件
的
主题
建模之后,我得到了描述所有
主题
的
类似
单词
,结果是不准确
的
。
python-2.7
、
lda
、
topic-modeling
corpus, num_topics=10, id2word = dictionary)问题是我
的
结果有相似的词语来描述所有的话题如果有人能帮助我取得更好
的
结果,那就太好了。以下是我
的
成果: (0,u‘0.019*威尔+0.010*经验+0.009*帐户+0.009*财务+0.008*会计+0.008*财务+0.008*团队+0.007*报告’),(4,u‘0.016*威尔
浏览 3
提问于2016-10-21
得票数 3
1
回答
R中
的
无监督情感分析
r
、
unsupervised-learning
、
sentiment-analysis
你如何评价无监督
的
情感分析? 我正在阅读关于评估情感分析
的
文章,并了解到许多正在使用
的
分类模型,这些数据都有目标/标签变量。如何评估只包含没有目标/标签变量
的
文本
的
调查?现在,我只是给反应一个情感评分(积极/消极/中性),但我有困难接近验证与1000+
的
反应。有什么想法/建议吗?
浏览 0
提问于2020-07-15
得票数 0
2
回答
如何在
每个
主题
LDA中获得唯一
的
单词
?
python
、
gensim
、
word
、
lda
我正在尝试为
每个
主题
获取
唯一
的
单词
。我使用gensim,这一行帮助我生成我
的
模型但我已经在两个不同
的
主题
中重复了
单词
,我希望
每个
主题
有不同
的
单词
浏览 0
提问于2019-09-03
得票数 2
1
回答
如何在邮递员中动态添加/发送请求
postman
基于测试数据,是否有一种在邮递员中添加/发送请求
的
方法? 正如屏幕截图中提到
的
,集合中
的
“
获取
单词
列表详细信息”调用会为我
获取
<e
浏览 2
提问于2019-09-27
得票数 0
1
回答
在gensim LDA中,有没有一种方法可以构建一个文档明智
的
方法来衡量一个
主题
是否适合它
gensim
、
lda
例如,如果
主题
A具有以下分布:
单词
A: 0.6,
单词
B: 0.3,
单词
C: 0.1。基于文档中包含
单词
C
的
事实,该文档已被归类为
主题
A。它没有其他
单词
(既不是来自
主题
A,也不是来自任何其他
主题
)。有没有什么指标告诉你,即使它被分配了
主题
A,它也是一个弱分配
浏览 56
提问于2021-03-22
得票数 0
1
回答
如何在pyLDAvis中
获取
每个
主题
的
单词
列表
nlp
、
lda
我一直在查看文档,但似乎无法找到一种方法来
获取
模型中
每个
主题
的
单词
集。我有20个
主题
,我想得到前20个左右的话,为
每个
主题
。有人有办法
获取
这些数据吗?
浏览 0
提问于2018-11-08
得票数 1
回答已采纳
3
回答
主题
建模中
的
自动
主题
标注
machine-learning
、
nlp
、
topic-model
、
python-3.x
我只是想知道是否有一种方法可以自动获得
主题
建模中
主题
的
标签。如果有任何python实现,这将是非常有帮助
的
。
浏览 0
提问于2020-06-28
得票数 3
回答已采纳
3
回答
NLP:计算一个文档属于一个
主题
的
概率(用一袋
单词
)?
machine-learning
、
nlp
给定一个
主题
,如何计算文档“属于”该
主题
(即体育)
的
概率。这就是我要做
的
事:75% of sports documents havehave the word "stadium" 40% have the word "contract"
浏览 8
提问于2013-07-28
得票数 0
回答已采纳
1
回答
Mahout文本挖掘-给定奇异值
的
最重要
的
单词
mapreduce
、
mahout
问题:是否有一种简单
的
方法可以查看与
每个
奇异值相关
的
最重要
的
单词
? 背景:I已经将Mahout
的
奇异值分解工具应用于一组新闻文章。这些文章来自两个
主题
: 1)体育;2)商业。我希望看到与
每个
奇异值相关
的
最重要
的
词。例如,对于一个单一
的
值,我
可能
期望
最
突出
的
词是体育术语:得分,球队,球员,教练。对于另一个单一
的
价值,我
可能
浏览 2
提问于2013-08-25
得票数 0
1
回答
获取
文本字段中使用最多
的
前十名
单词
elasticsearch
、
kibana
我有一个包含数千个文档
的
索引,
每个
文档都有一个全文字段。如果
可能
的话,我也想要一种在Kibana上可视化
的
方法。
浏览 0
提问于2018-04-12
得票数 3
回答已采纳
1
回答
如何更改LdaMulticore中
的
默认字数?
python
、
gensim
、
lda
、
topic-modeling
LDA默认在一个
主题
中显示10个
单词
。我想将这些数字增加15。我尝试了"topn“和"num_words”关键字,但这两个关键字都给我一个错误。如何更改此默认行为?
浏览 18
提问于2019-04-24
得票数 2
1
回答
关键词建议算法
algorithm
、
machine-learning
、
nlp
、
keyword
我一直在做一个项目,要求我根据产品
的
描述给出关键词/关键词建议。我想要
的
是:基于描述
的
机器生成
的
关键字/关键字。我所做
的
研究:(基于NLP
的
方法)这个问题可以分为两种不同
的
方法。不使用过去
的
数据:只是总结当前
的
描述 这将是一种不使用数据库中描
浏览 3
提问于2016-07-20
得票数 0
1
回答
使用iBATIS实现一对多插入
spring
、
insert
、
ibatis
我得到了带有属性Topics
的
类型Word,它是一个列表对象。我在数据库中有两个表:
单词
和
主题
。我想在词表中写一个
单词
,并将
每个
主题
与其相应
的
idWord存储在
主题
中。对于
单词
的
insert语句,我使用generatedKey和keyProperty来
获取
mySQL分配给
单词
的
idWord。但我不知道该怎么做,我读过iBATIS文档,但这对于INSERT语句来说太
浏览 0
提问于2011-09-21
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券