腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(5780)
视频
沙龙
2
回答
Mallet
主题
建模
-
主题
键
输出
参数
、
在
MALLET
主题
建模
中,--output-topic-keys [FILENAME]选项在每个
主题
旁边
输出
一个
参数
,该
参数
在
MALLET
站点的教程中称为
主题
的"Dirichlet
参数
“。我想知道这个
参数
代表什么?它是LDA模型中的β吗?如果不是,它是什么,它的意义和用途是什么。 我注意到,当我在生成
主题
模型时不使用
参数
优化选项时,该
参数</em
浏览 55
提问于2017-07-18
得票数 4
回答已采纳
1
回答
使用
Mallet
主题
键
输出
参数
的
主题
建模
、
我希望我仍能得到更详细的解释,因为我在
输出
文件中很难理解这些数字。
输出
数字之和能告诉我们什么?例如,对于20个
主题
和2000年迭代的一个优化值20,
输出
的总和约为2。在相同的语料库中,15个
主题
/1000次迭代/优化10的结果为0,77,10
主题
/1000次/优化10的结果为0,72。这是什么意思?这意味着什么吗?而且,这些人将这些结果称为
参数
,但据我所知,
参数
是优化区间,而不是
输出
的结果。那
浏览 0
提问于2019-12-23
得票数 0
回答已采纳
1
回答
使用
mallet
进行
主题
建模
、
、
、
我正在尝试使用
Mallet
的
主题
建模
,但有一个问题。我正在考虑对我每个月抓取的文档这样做。有人能给点建议吗?那么,
主题
建模
是否更适合于固定<
浏览 4
提问于2010-09-03
得票数 2
回答已采纳
2
回答
如何在gensim中使用
mallet
设置
主题
模型的随机种子?
、
、
、
我一直试图通过使用
mallet
作为gensim中的库来保持
主题
建模
的
输出
稳定。然而,我发现
mallet
可以设置随机种子,但我在gensim中看不到任何
参数
来设置它。
浏览 1
提问于2018-10-11
得票数 2
1
回答
IllegalArgumentExce错误:无法从文件complaints.
mallet
中读取InstanceList
、
我试着用
Mallet
做一个研究项目,而且我一直在犯同样的错误。再说一遍(最后一行应该有C:> ) 在命令提示符中,复制并粘贴“Topic例程”文本文件中的语法。下面突出显示了您需要更
浏览 3
提问于2017-07-13
得票数 1
1
回答
从训练模型-
MALLET
看
主题
权重的推断
我从一堆指定20个
主题
的文本中训练了一个模型,但是当我在一个新文档上运行推理器时,它只
输出
10个
主题
权重。下面是我使用的命令: bin/
mallet
导入-文件-输入/data/research/bazaarvoice/data/review_nouns.txt -
输出
/data/research/bazaarvoice/
mallet
列车-
主题
\-输入/dat
浏览 4
提问于2016-06-11
得票数 1
1
回答
使用
Mallet
Api for Java进行
主题
建模
、
、
您好,我必须使用
Mallet
Java API进行
主题
建模
,但我对
Mallet
是个新手,所以我发现理解和使用
Mallet
库真的很难。有谁知道在哪里可以找到
主题
建模
的源代码来理解这些库?
浏览 2
提问于2011-06-25
得票数 2
1
回答
在
mallet
中进行hLDA
主题
建模
的cmd
我正在尝试使用hLDA在已经检查过的
mallet
.Ihave 中进行
主题
建模
。使用cmd根据这个。默认情况下,将执行LDA
主题
建模
。如何将其更改为hLDA?任何建议都会很有帮助。
浏览 5
提问于2017-03-10
得票数 1
1
回答
如何用木槌提取
主题
词
、
、
我已经用
mallet
导入了文件,现在我想从导入的数据中
建模
主题
,并将它们存储在文本文件中,在那里我将能够读取这些
主题
。有人能帮助编写
主题
提取的命令吗?就像我在下面输入的
主题
提取命令一样,但是它会抛出异常。bin\
mallet
导入-dir--输入D:\Data\test1 1--
输出
test1.
mallet
--保持顺序--删除--停止词--超停止词extra.txt 通过删除--保持顺序--删除--停止词
浏览 1
提问于2015-11-03
得票数 1
回答已采纳
1
回答
如何同时在20000文档上运行
主题
模型?
、
、
我有20000篇新闻文件要对其进行
主题
建模
:#!/bin/
mallet
import-dir --input /Users/JasonDou/code/internet_finance/bydocafterseg2/159047443.txt --output bydoc-input
浏览 2
提问于2016-06-06
得票数 0
回答已采纳
2
回答
基本使用。第一步
、
我试图在
主题
建模
等方面使用
Mallet
,没有任何解释。我的目的是获得我现在拥有的M文档的N个
主题
,将每个文档分类为一个或多个
主题
(doc 1=
主题
1;doc 2=
主题
2,可能还有
主题
3),并根据这个结果对未来的新文档进行分类。我第一次尝试使用bigartm,但是在这个程序中没有发现任何用于分类的东西,只有
主题
建模
。所以
Mallet
,我创建了一个corpus.txt文件,格式如下: Doc.num.现
浏览 0
提问于2016-11-14
得票数 2
回答已采纳
0
回答
mallet
如何为LDA设置默认的超
参数
,即alpha和beta?
关于
Mallet
主题
建模
,我有一个问题要问。它如何设置LDA的默认超
参数
,即alpha和beta?
浏览 0
提问于2017-06-15
得票数 0
回答已采纳
1
回答
检测适当数量的
主题
的不同方法
、
、
我在R中实现了LDA
主题
建模
。1.
mallet
3. or this way https://cran.r-project.org/web/packages/ldatuning/vignettes
浏览 0
提问于2020-06-11
得票数 1
回答已采纳
1
回答
如何从文本中提取关键词(标签)
、
、
、
目前,我正试图在Java中实现一个标记引擎,并寻找从文本(文章)中提取关键字/标记的解决方案。我发现了一些关于堆栈溢出的解决方案,建议使用Pointwise互信息。 PMI(term, doc) = log [ P(term, doc) / (P(term)*P(doc)) ]我已经有了一个很长的文本语料库和一个文章集。这些文章不是语料库的一部分。语料库用lucene索引。
浏览 1
提问于2013-01-15
得票数 7
1
回答
如何在
mallet
中获取每个
主题
的概率
我正在用
mallet
做
主题
建模
。我已经导入了我的文件(每个文档在一行中),我用200 topics.Now训练了
mallet
。对于每个topic.Now,我有200个
主题
和与它们相关的单词。我需要知道每个
主题
的probability.How,我可以知道吗?谢谢
浏览 0
提问于2013-10-06
得票数 1
5
回答
Mallet
主题
建模
、
、
、
我一直在使用
mallet
为一个包含100,000行(按
mallet
格式约34MB)的文本文件推断
主题
。
浏览 0
提问于2011-03-02
得票数 6
5
回答
主题
模型和LDA教程
、
我想知道你们是否有一些关于
主题
模型和LDA的好教程(快速和直截了当),直观地教授如何设置一些
参数
,它们意味着什么,如果可能的话,还有一些实际的例子。
浏览 0
提问于2015-01-08
得票数 9
1
回答
Mallet
:
主题
N-gram
、
、
、
我想使用--use-ngrams true选项运行
mallet
,但似乎无法使其正常工作。我使用以下命令导入了我的数据:现在我想训练一个
主题
ngram模型: bin/
mallet
train-topics --input topic-input.
mallet
浏览 2
提问于2012-03-27
得票数 2
回答已采纳
1
回答
Mallet
Java中的错误
、
、
、
我想做
主题
建模
,所以,我运行了下面的命令:它告诉我:-
主题
建模
目前只支持特征序列:导入数据时使用--keep-sequence选项。当我添加--keep-sequence时,我的命令变成:- bin\
mallet
train-topics --input web.
mallet
--output-state
浏览 2
提问于2017-08-02
得票数 3
1
回答
为什么用
Mallet
进行LDA时不能选择beta
参数
?
我最近正在使用
Mallet
进行LDA
主题
建模
。我认识到我能够将算法的Alpha超
参数
传递给
Mallet
,但是LDAMallet类不包含任何beta
参数
的变量。你们能告诉我这是怎么回事吗?我知道我可以每隔n个时间间隔开启超
参数
优化,这将重新计算
参数
的最佳值,但即使在那里,我也不知道它们是按照什么标准进行优化的。 最好的,尼罗
浏览 22
提问于2020-05-18
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券