腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如果
我
不知道
主题
的
数量
,
可以
使用
LDA
主题
建模
吗
、
、
、
我
有超过10万个报纸问题
的
.txt文件,
我
需要定义保护主义
的
词汇领域。尽管如此,报纸问题
的
主题
非常不同,
我
不能知道
主题
的
总数。
我
是否仍然
可以
使用
LDA
主题
建模
来查找词法领域,或者是否有其他方法(可能是监督学习)?
浏览 17
提问于2019-06-24
得票数 0
1
回答
如何为
LDA
生成合成文本?
、
、
我
想玩
LDA
主题
建模
,即查看文档长度、
主题
编号等对准确性
的
影响(
我
知道这是在其他地方做
的
,但似乎没有人公布他们最初是如何生成文档
的
!) 有没有人有为
LDA
模型生成数据
的
方法?在哪里
我
可以
控制
主题
号,文档号等?
浏览 0
提问于2021-08-15
得票数 3
1
回答
计算
主题
建模
的
最优
主题
数(
LDA
)
、
、
、
我
将通过
LDA
来做
主题
建模
。
我
运行命令来查看
主题
的
最佳
数量
。它
的
输出如下:它与我所见过
的
任何其他情节都有一点不同。你觉得
可以
吗
?或者
使用
其他算法比
使用
LDA
更好。值得一提
的
是,当我运行
我
的
命令来可视化
主题
--10个
主题
的
关
浏览 1
提问于2021-04-16
得票数 1
回答已采纳
1
回答
计算
主题
建模
的
最优
主题
数(
LDA
)
、
、
、
我
将通过
LDA
来做
主题
建模
。
我
运行命令来查看
主题
的
最佳
数量
。它
的
输出如下:它与我所见过
的
任何其他情节都有一点不同。你觉得
可以
吗
?或者
使用
其他算法比
使用
LDA
更好。值得一提
的
是,当我运行
我
的
命令来可视化
主题
--10个
主题
的
关
浏览 0
提问于2021-04-17
得票数 5
回答已采纳
1
回答
主题
模型中
的
动态
主题
数量
、
、
、
我
对
主题
建模
还是个新手。
我
的
目标是从文档中找到关键
主题
。为此,
我
计划
使用
lda
。但在
lda
中,
主题
的
数量
应该是预先定义
的
,
我
相信
如果
来自其他领域
的
文档不在训练语料库中,它将不会给出适当
的
结果。有没有其他
的
解决方案?
我
的
想法
浏览 1
提问于2016-11-17
得票数 3
1
回答
Gensim中
的
主题
模型评价
、
我
一直在尝试
使用
进行
LDA
主题
建模
。
我
似乎在Gensim中找不到任何
主题
模型评估工具,它
可以
报告一个
主题
模型在被搁置
的
评估文本上
的
困惑,从而便于随后对
LDA
参数(例如
主题
数量
)进行微调。
如果
有人能说明
我
如何在Gensim中进行
主题
模型评估,那将是非常感谢
的
。这个问题也被发布在
浏览 4
提问于2013-10-27
得票数 1
回答已采纳
6
回答
潜Dirichlet分配与递阶Dirichlet过程
、
、
潜Dirichlet分配(
LDA
)和分级Dirichlet过程(HDP)都是
主题
建模
过程。主要
的
区别是
LDA
要求指定
主题
的
数量
,而HDP不需要。为什么会这样?这两种
主题
建模
方法
的
区别、利弊是什么?
浏览 0
提问于2014-05-18
得票数 62
回答已采纳
1
回答
如何
使用
LDA
或任何
主题
建模
算法获取文档
的
意图
、
、
、
我
需要基于文档
的
意图对一组文档进行聚类,
我
计划
使用
LDA
(潜在Dirichlet分配-
主题
建模
)。
浏览 0
提问于2019-08-20
得票数 0
1
回答
用
LDA
快速确定大型语料库
的
最优
主题
数
、
、
、
我
有一个包含大约16万份文件
的
语料库。
我
想
使用
R中
的
LDA
(特别是
lda
包中
的
函数
lda
.collapsed.gibbs.sampler )对其进行
主题
建模
。
我
想确定
主题
的
最佳
数量
。一般
的
方法是有一个
主题
数
的
向量,例如从1到100,然后运行100次,找出谐波均值最大或最困
浏览 0
提问于2018-07-05
得票数 1
1
回答
在scikit-learn
的
LDA
实现中,
我
如何在整个语料库中按频率对
主题
进行排序?
、
、
我
已经
使用
了scikit-学习执行
LDA
主题
建模
,
我
最终想按整个语料库
的
显着性/频率对
主题
进行排序,但我
不知道
如何做到这一点。
我
使用
了幽门,虽然似乎没有办法提取频率和顺序,
我
需要创建特定
的
可视化。这基本上是
我
到目前为止在
主题
建模
方面所做
的
。
LDA
= Latent
浏览 0
提问于2021-07-28
得票数 1
回答已采纳
1
回答
LDA
在
主题
建模
前
的
降维
、
、
、
我
想用
LDA
做一些
主题
建模
,但不幸
的
是,
我
的
数据相当稀疏,结果并不令人满意。因为
我
仍然想尝试用
LDA
来解决
我
的
任务(即使可能有更好
的
可能性),
我
正在考虑在
LDA
之前
使用
某种降维方法。
我
知道
LDA
用于
主题
建模
,但也
可以
用于降维,那么在
浏览 9
提问于2020-05-23
得票数 0
回答已采纳
1
回答
对于
主题
建模
,在Amazon中,
LDA
和NTM有什么区别?
、
我
在寻找
LDA
和NTM之间
的
区别。您将在NTM上
使用
LDA
的
用例是什么?根据AWS文档:虽然您
可以
同时
使用
Amazon和SageMaker算法进行
主题<
浏览 5
提问于2019-11-29
得票数 5
2
回答
主题
建模
中
的
LSA、
LDA
或NMF?
我
正试图通过Python & NLP实现
主题
建模
,但无法确定
我
应该
使用
哪种算法。
我
研究过潜在语义分析(LSA)、潜在Dirichlet分配(
LDA
)和非负矩阵因式分解(NMF),但是如何确定哪一种算法最适合于特定任务?
如果
我
只是连续地尝试所有这些,那么如何衡量结果呢?
浏览 0
提问于2020-06-19
得票数 2
1
回答
基于Gensim
的
隐狄利克雷分配实现
、
、
、
、
我
正在做关于
LDA
主题
建模
的
项目,
我
使用
gensim (python)来做。
我
读了一些参考资料,上面说要获得最好
的
模型
主题
,我们需要确定两个参数,通过次数和
主题
数量
。这是真的
吗
?对于通道
的
数量
,我们将看到在哪个点上通道是稳定
的
,对于
主题
的
数量
,我们将看到哪个
浏览 17
提问于2020-04-09
得票数 0
1
回答
使用
LDA
进行
主题
建模
和机器学习
、
、
我
想标记一些文档,
我
尝试了
LDA
算法,但结果太混乱了。
我
决定
使用
有监督
的
方法,所以我创建了自己
的
主题
-单词矩阵,但我
不知道
如何生成文档-
主题
矩阵。你知道一些好
的
主题
建模
算法
可以
使用
主题
-词矩阵来训练
吗
?
浏览 0
提问于2017-06-02
得票数 0
5
回答
如何确定
LDA
的
主题
数量
?
、
、
我
是
LDA
的
大一新生,
我
想在
我
的
工作中
使用
它。然而,也出现了一些问题。
我
的
问题是“一系列”是什么意思?
浏览 0
提问于2013-07-02
得票数 23
1
回答
有没有一种方法来检查一个单词会出现在哪个
主题
中?
、
、
、
我
已经
使用
Gensim
的
LDA
主题
建模
来创建6个
主题
。但现在,
我
想给模型一个词,看看哪个
主题
将属于。这个是可能
的
吗
?
如果
是,通过哪种方法?Ex.输入单词(‘Fitness’) =>
LDA
模式=>中单词最适合
的
主题
(
如果
在字典中)Topic 1: 2%,To
浏览 8
提问于2022-04-08
得票数 -1
1
回答
如何在twitter数据上形成
LDA
文档
、
、
、
、
我们需要对直播流上
的
twitter推文进行
主题
建模
,输入使spark流,并将数据存储到HDFS。在收集
的
数据上运行批处理作业。批处理任务是在tweet中查找底层
主题
。为此,我们
使用
潜在狄利克雷分配(
LDA
)算法来找出
主题
。我们接收最大字符数为140
的
推文形式
的
数据,并将其存储为HDFS中
的
一行。
我
是
LDA
算法
的
新手,对此有基本
的
浏览 1
提问于2017-04-17
得票数 1
1
回答
相同
的
LDA
参数和数据输入,但我每次都有不同的话题?
、
、
我
正在
使用
星火MLlib框架
的
LDA
。为了确定
主题
的
数量
,
我
尝试:运行
LDA
模型,增加
主题
的
数量
,然后找出
主题
的
最佳
数量
有最大值日志
的
可能性。但是
如果
我
再次以同样
的
方式和相同
的
输入数据运行。
我
有不同
的
价值
浏览 1
提问于2016-01-24
得票数 3
回答已采纳
2
回答
LDA
主题
建模
.培训和测试
、
我
读过
LDA
,
我
理解当输入一组文档时如何生成
主题
的
数学。 引用指出,
LDA
是一种算法,在给定一个文档集合而不需要更多(不需要监督)
的
情况下,它
可以
发现该集合中文档所表示
的
“
主题
”。因此,通过
使用
LDA
算法和Gibbs采样器(或变分Bayes),
我
可以
输入一组文档,作为输出,
我
可以
得到
主题
。每个
浏览 5
提问于2012-06-22
得票数 44
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习当中的数学闪光:如何直观地理解 LDA
R语言对NASA元数据进行文本挖掘的主题建模分析
如何用 Python 从海量文本抽取主题?
R语言社区主题检测算法应用案例
信息过载叫苦不迭?机器学习教你如何将文本化繁为简
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券