腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将
LDA
与
其他
主题
模型
进行
比较
?
、
、
我对
主题
建模领域很感兴趣,我即将开发自己的算法。我目前面临的问题是
如何将
我的工作结果与最先进的
模型
(如
LDA
)的结果
进行
比较
。由于
LDA
的结果是不确定的(据我所知,如果算法第二次运行,它们不能被设置为相同),我如何得出结论,即我的
模型
与
使用不同配置集的
LDA
模型
相比有多好?
浏览 12
提问于2019-03-07
得票数 0
1
回答
在自然语言中
比较
几个语料库的最佳方法是什么?
、
、
、
、
我一直在为一个研究项目(使用Gensim和python)用自然语言编写叙事报告的
LDA
主题
模型
。我有几个较小的语料库(每个语料库从1400到200个文档-我知道,这很小!)我想
进行
比较
,但除了查看每个
LDA
模型
(例如使用pyLDAviz)之外,我不知道如何
进行
比较
。我的学术背景不是CS,而且我对NLP还是个新手。 在语料库/
主题
模型
中
比较
主题
的一些好方法
浏览 0
提问于2017-09-01
得票数 4
1
回答
python - sklearn潜在Dirichlet分配变换诉Fittransform
、
我正在使用sklearn的NMF和
LDA
子模块来分析未标注的文本。我阅读了文档,但不确定这些模块中的转换函数(NMF和
LDA
)是否
与
R的
主题
模型
中的后验函数相同(请参见)。基本上,我正在寻找一个函数,它将允许我使用训练集数据训练的
模型
来预测测试集中的
主题
。我预测了整个数据集上的
主题
。然后将数据分解为训练集和测试集,对训练集
模型
进行
训练,并利用该
模型
对测试集
进行
转换。虽然预期我不会得
浏览 3
提问于2016-11-14
得票数 7
回答已采纳
2
回答
LDA
和
主题
模型
、
、
、
我研究过几个weeks.But的
LDA
和
主题
模型
,由于我的数学能力较差,不能完全理解它的内部算法,我使用了GibbsLDA实现,输入了大量的文档,并将
主题
数设置为100,我得到了一个名为"final.theta“的文件,它存储了每个document.This中每个
主题
的
主题
比例,结果很好,我可以用
主题
比例来做很多
其他
的事情。但是当我在
LDA
上尝试Blei的C语言实现时,我只得到了一个名为final.gamma的文件,但我不知
浏览 0
提问于2012-03-07
得票数 4
1
回答
文本数据中
主题
(集群)数量的选择
、
、
、
、
在分析文本数据时,我正在寻找关于
主题
/集群数量选择的建议。特别是,我正在分析一个包含200000多个tweet的数据集,并在其上执行一个潜在的Dirichlet分配
模型
,以找到代表我数据集中tweet的主要
主题
的集群。此外,您认为有
其他
方法和/或常规规则可以依赖于选择集群的数量吗?
浏览 0
提问于2021-09-05
得票数 1
1
回答
在Python中使用Gensim
进行
主题
建模
、
、
、
、
我希望在python中使用gensim包(用于
LDA
)的
主题
建模,以便为A类和B类训练一个
模型
,同时我对
主题
建模和Python都很陌生。有人知道我该怎么做吗?
浏览 3
提问于2014-12-05
得票数 1
回答已采纳
2
回答
主题
建模,但
与
已知的
主题
?
好的,通常是
主题
模型
(如
LDA
,pLSI等)用于推断一组文档中可能以无监督方式出现的
主题
。我想知道是否有人对我
如何将
我的问题塞进
LDA
框架有任何想法,因为有非常好的工具可以解决
LDA
问题。在这种情况下,文档只能有一个
主题
。 在这种情况下,单词是基的三重奏(目前而言)。这与经典的
LDA
模型
的主要区别在于,我提前知道了
浏览 2
提问于2013-05-28
得票数 6
1
回答
如何
比较
LDA
和TF-国防军?
、
、
、
、
我正在
进行
文本挖掘,以从文档中提取
主题
。我从潜在的Dirichlet分配(
LDA
)开始,这很有效,但后来我遇到了TF-以色列国防军的K-均值聚类,这对我来说效果更好。我想对两者
进行
评估,但我无法找到任何有用的验证或度量来
比较
这两种情况。
如何将
这两者
与
有用的度量
进行
比较
呢?
浏览 0
提问于2017-06-14
得票数 2
2
回答
使用Gensim获得
LDA
-
模型
的最佳
主题
数量的最佳方法是什么?
、
、
、
、
我正试图在Gensim中获得
LDA
模型
的最佳
主题
数.我发现的一种方法是计算每个
模型
的日志可能性,并相互
比较
,例如在上。因此,我研究了使用Gensim计算
LDA
模型
的日志可能性,并看到了以下帖子:是否有更好的方式获得最佳数量的
主题
与
Gensim?
浏览 5
提问于2015-08-31
得票数 11
1
回答
在R中使用
LDA
对新文本
进行
分类
、
、
、
我第一次尝试使用R
进行
主题
建模。因此,这可能是一个非常愚蠢的问题,但我被困,谷歌还没有给出一个明确的答案。 ap_
lda
<-
LDA
(AssociatedPress_train, k = 5, control = list(seed
浏览 0
提问于2018-01-15
得票数 4
回答已采纳
1
回答
如何从已有的文本聚类中提取
主题
?
、
、
、
我已经尝试在原始文本语料库(预聚类)上使用
LDA
,并获得了许多
主题
,但是我不确定
如何将
这些
主题
映射到我现有的每个聚类上。有没有
其他
方法可以推荐
LDA
,或者
LDA
是正确的方法,我该如何继续呢?在线材料只展示了
如何将
lda
主题
映射到文档句子上,而不是预先存在的聚类。如果我这样做,并根据它们分配的
主题
对这些句子
进行
分割,我将得到
与
原始聚类不同的结果(这并不理想)。
浏览 38
提问于2019-12-16
得票数 1
回答已采纳
1
回答
LDA
直觉
、
、
、
、
有人能解释
LDA
-
主题
模型
是
如何将
单词分配给
主题
的吗?我理解
LDA
模型
的生成特性,但是该
模型
如何认识到“拉布拉多”和“狗”是相似的词/在同一个集群/
主题
中?有一种相似性度量吗?
LDA
的学习参数是:
主题
词的分配、
主题
词的概率向量和文档
主题
概率向量。但它是如何学会的呢?
浏览 0
提问于2020-05-03
得票数 1
回答已采纳
3
回答
主题
发现/发现的最佳
模型
、
、
、
、
在简短的非结构化文档中发现
主题
的最佳
模型
是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
主题
对齐/
主题
建模
、
、
、
、
什么是最有效的方法来检测这篇文章是否主要是关于一个特定的
主题
,但没有大量的数据
进行
培训?我的任务是确定一份文件有多少是关于天气、假期或
其他
几个特定
主题
的。我期待
LDA
和TFIDF,但据我所知,这种方法是不受监督的,并很好地根据词汇量对大量文档
进行
聚类/分组。这些技术在控制算法应该关注的
主题
方面有一定的局限性。此外,在我的例子中,我没有太多的数据来训练
模型
。因此,我正在考虑生成一些特定
主题
的标记特征列表,然后用word2vec
浏览 0
提问于2020-04-23
得票数 1
1
回答
两种
LDA
模型
的
比较
、
、
我正在研究Twitter数据的
主题
建模。我提取数据并将其存储在MySQL表中。这些列是日期、位置、UserID、文本、tweetID、weekID(基于我指定的日期,它属于哪个星期)。我还收集了每周的数据,并为每周建立了一个
LDA
模型
。我目前正在使用来自Gensim的pyLDAvis来可视化每周的
主题
。有没有办法
比较
我每周的
LDA
模型
。我想
比较
一下它们,这样我就可以看到一个特定的话题是如何在几周内发生变化的。任何想法都是非常感谢的。 我试图建立每周的<
浏览 5
提问于2022-03-28
得票数 0
1
回答
是否使用(
LDA
,HDP)自动创建
主题
?
、
我正在做简历(简历)的分类工作,我已经使用了
LDA
。通过设置(N=3),我在3个不同的CV (营销,计算机,沟通)概念上的结果是好的。现在的问题是,我如何为具有金融概念(或
其他
概念)的新简历创建新
主题
(当然是通过将其添加到现有
主题
中)? 事实上,我的目标是每次都生成新的
主题
,以获得新的概念。我每天都会用不同的概念得到不同的简历,我对选择哪种算法(HDP,On_Line
LDA
)
进行
自动分类有疑问。
浏览 1
提问于2014-01-27
得票数 1
1
回答
使用
LDA
主题
模型
作为分类
模型
输入
、
、
我使用大的训练数据集制作
LDA
模型
来制作
主题
模型
。因此,我尝试使用这个
LDA
模型
来对训练数据集中没有使用的新句子
进行
分类。欢迎使用Python分享示例代码。
浏览 4
提问于2019-12-05
得票数 0
1
回答
文本处理,如何使用
LDA
分配一个
主题
-> 1文档?
、
、
、
、
我有两个文件,我想从上面抽取两个
主题
(Music,Science)
lda
= gensim.models.ldamodel.LdaModel(corpus=my_corpus, id2word=corpus_dictionary, num_topics=2) print(
lda
.print_topicnot +
浏览 5
提问于2015-04-12
得票数 1
1
回答
使用
LDA
随时间分布
主题
、
、
、
我的目标是识别tweet的
主题
,并可视化
主题
的分布如何随着时间的推移而变化。据我所知,最好的方法是使用stm包,但我对它有一些问题。所以,我唯一的选择就是做一个简单的
LDA
。基于每个tweet的
主题
份额,我汇总了每年的
主题
份额,并将每个
主题
份额
与
每年的总份额
进行
比较
(
与
这里的https://towardsdatascience.com/thats-mental-using-
lda
浏览 78
提问于2021-05-08
得票数 1
1
回答
使用Gensim或
其他
python
LDA
包来使用来自Mallet的经过训练的
LDA
模型
、
、
我有一个在Java中通过Mallet训练的
LDA
模型
。从Mallet
LDA
模型
生成了三个文件,这允许我从文件运行
模型
并推断新文本的
主题
分布。现在,我想实现一个Python工具,它能够根据经过训练的
LDA
模型
,在给定新文本的情况下推断
主题
分布。我不想在Python中重新训练
LDA
模型
。因此,我想知道是否可以将经过训练的Mallet
LDA
模型
加载到Gensim或任
浏览 18
提问于2017-05-04
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
汤姆猫:《Talking Ben AI》已接入OpenAI与Google的大模型及其他AI服务进行测试
Spark平台下基于LDA的k-means算法实现
python主题LDA建模和t-SNE可视化
CMU最新视觉特征自监督学习模型——TextTopicNet
技术干货:一文详解LDA主题模型
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券