腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
我们
可以
恢复
对
MALLET
模型
的
训练
吗
?
、
我们
可以
使用那个“快照”
恢复
Gibbs采样
的
迭代
吗
?
浏览 8
提问于2021-03-07
得票数 1
1
回答
使用序列标记
的
文本分类/文档分类
、
、
、
我将文档排列在称为categories
的
类
的
文件夹中。对于新
的
输入(例如提出
的
问题),我必须识别它
的
类别。使用
MALLET
做这件事最好
的
方法是什么?我已经阅读了多篇关于这方面的文章,但都找不到这样
的
方法。 另外,我是否需要对输入文本进行序列标记?
浏览 2
提问于2016-07-27
得票数 0
3
回答
使用
mallet
推断主题,使用保存
的
主题状态
、
、
我已经使用以下命令从一些文档生成了一个主题
模型
:但是,我没有使用--output-model选项来生成序列化
的
主题
训练
器对象。有没有办法
可以
使用状态文件来推断新文档
的
主题?
训练
很慢,如果我必须从头开始创建序列化
的
模型</em
浏览 1
提问于2011-07-20
得票数 0
1
回答
CRF
Mallet
模型
文件
、
当
我们
训练
CRF
Mallet
时,
模型
文件是什么?java -cp -cp cc.
mallet
.fst.SimpleTagger -培训真实
的
-
模型
文件nouncrf示例
浏览 1
提问于2016-02-19
得票数 0
回答已采纳
1
回答
如何将命令行
训练
的
主题
模型
读入Java类?
、
、
、
所以我有一个经过
训练
的
模型
,它是用
MALLET
通过命令行创建
的
。我想以某种方式将这个经过
训练
的
模型
导入到Java类中。我查看了
MALLET
文档,发现了他们
的
ParallelTopicModel类,但找不到一种合适
的
方法将
模型
导入为ParallelTopicModel,而这正是我想要做
的
。我知道
可以
在Java类内部使用
MALLET
浏览 0
提问于2017-03-15
得票数 0
4
回答
关于lda推断
、
、
现在,我正在使用
MALLET
包中
的
LDA主题建模工具
对
我
的
文档进行一些主题检测。最初一切都很好,我从中得到了20个主题。然而,当我尝试使用该
模型
推断新文档时,结果有点令人费解。例如,我故意在手动创建
的
文档上运行我
的
模型
,该文档只包含"FLU“主题之一
的
关键字,但我得到
的
每个主题
的
主题分布小于0.1。然后,我在一个已经采样
的
文档上尝试了相同
的
方法,其中一个
浏览 2
提问于2010-12-07
得票数 4
3
回答
关于潜在Dirichlet分配(
MALLET
)
的
问题
、
老实说,我不熟悉LDA,但我需要在我
的
一个项目中使用
MALLET
的
主题建模。我
的
问题是:给定特定时间戳内
的
一组文档作为主题
模型
的
训练
数据,使用
模型
(使用推理器)来跟踪主题趋势(对于文档+或-
训练
数据
的
时间戳)是合适
的
吗
?我
的
意思是,如果在
模型
构建阶段,
我们
只提供了我需要分析
的
数据集
的<
浏览 1
提问于2010-11-10
得票数 2
回答已采纳
1
回答
使用指示函数作为序列
模型
中
的
特征
、
我目前正在使用
Mallet
来
训练
使用CRF
的
序列
模型
。我已经了解了如何为
mallet
包提供特性(仅依赖于输入序列)。根据我
的
理解,在
mallet
中,
我们
必须计算特征函数
的
所有值(预先)。现在,我想使用依赖于令牌标签
的
指示器函数。这些函数
的
值取决于输出标签序列,在
训练
过程中,当输出标签序列已知时,我
可以
计算这些指示函数
的
值。但是,当我将这个经过<e
浏览 0
提问于2018-06-06
得票数 0
1
回答
使用Gensim或其他python LDA包来使用来自
Mallet
的
经过
训练
的
LDA
模型
、
、
我有一个在Java中通过
Mallet
训练
的
LDA
模型
。从
Mallet
LDA
模型
生成了三个文件,这允许我从文件运行
模型
并推断新文本
的
主题分布。现在,我想实现一个Python工具,它能够根据经过
训练
的
LDA
模型
,在给定新文本
的
情况下推断主题分布。我不想在Python中重新
训练
LDA
模型
。因此,我想知道是否
可以
将经过
训练</
浏览 18
提问于2017-05-04
得票数 5
1
回答
在Netbeans中运行
Mallet
、
、
所以我用
Mallet
创建了一个简单
的
标签应用程序。那么,现在我如何在代码中调用这个
模型
,这样我就
可以
用它创建一个接口了。因为I只能使用命令提示符加载
模型
。我真的很需要这些人,所以请帮帮我。 java -cp -cp cc.
mallet
.fst.Si
浏览 4
提问于2017-10-13
得票数 1
3
回答
使用
Mallet
Java Api进行主题建模
、
您好,我必须使用
Mallet
Java API进行主题建模,但我是新手,所以我发现理解和使用Java库真的很难。有谁有一些使用API进行主题建模
的
示例代码
吗
?
浏览 1
提问于2011-06-23
得票数 3
1
回答
如何在
mallet
中向现有主题
模型
添加新文档或批量处理大文档数
的
模型
、
我想使用主题建模,并找到适合我
的
MALLET
。 谢谢
浏览 3
提问于2014-10-29
得票数 0
1
回答
如何预测Gensim主题建模
的
测试数据
、
、
、
、
我已经使用Gensim LDAMallet进行主题建模,但是
我们
可以
用什么方法来预测样本段落并使用预先
训练
过
的
模型
得到它们
的
主题
模型
。= data_words_bigrams corpus = [id2word.doc2bow(text) for text in texts]
mallet
_path='/home/riteshjain/anaconda3
浏览 0
提问于2019-04-22
得票数 1
回答已采纳
1
回答
MALLET
中主题
模型
的
增量式
训练
、
根据
MALLET
,
可以
逐步地培训主题
模型
: 在最后一个命
浏览 1
提问于2014-04-04
得票数 5
1
回答
为什么单个文档和批量文档使用
MALLET
主题推理会得到不同
的
结果?
、
、
、
我正在尝试使用
Mallet
2.0.7执行LDA主题建模。从
训练
过程
的
输出来看,我
可以
训练
LDA
模型
并获得良好
的
结果。此外,我
可以
使用该过程中内置
的
推理器,并在重新处理我
的
训练
文件时获得类似的结果。然而,如果我从较大
的
训练
集中提取一个单独
的
文件,并使用推理器
对
其进行处理,我会得到非常不同
的
结果,这是不好
浏览 0
提问于2011-10-03
得票数 8
回答已采纳
1
回答
线程安全还是多线程CRF在Java中支持连续变量?
、
、
因此,我需要多线程计算来处理这个计算,要么通过并行
训练
多个CRF来处理,要么在单个线程上
对
每个CRF进行
训练
,或者2)以多线程
的
方式
训练
每个CRF。在
Mallet
中,我找到了一个CRF
训练
器
的
多线程版本,它实现了选项2。然而,在我
的
情况下,我需要对连续变量
的
支持,对于这些变量,fst似乎没有支持,而且它似乎需要支持。作为另一种选择,我实现了备选方案1,在该选项中,我在不同
的
线程中并行地为实验
浏览 1
提问于2015-09-02
得票数 1
回答已采纳
2
回答
基本使用。第一步
、
我
的
目的是获得我现在拥有的M文档
的
N个主题,将每个文档分类为一个或多个主题(doc 1=主题1;doc 2=主题2,可能还有主题3),并根据这个结果
对
未来
的
新文档进行分类。我第一次尝试使用bigartm,但是在这个程序中没有发现任何用于分类
的
东西,只有主题建模。所以
Mallet
,我创建了一个corpus.txt文件,格式如下: Doc.num.现在,我
可以
从这个文件中获取主题,然后将其转换为
mallet
的
功能序列格式。bin/
浏览 0
提问于2016-11-14
得票数 2
回答已采纳
1
回答
从
训练
模型
-
MALLET
看主题权重
的
推断
我从一堆指定20个主题
的
文本中
训练
了一个
模型
,但是当我在一个新文档上运行推理器时,它只输出10个主题权重。下面是我使用
的
命令: bin/
mallet
导入-文件-输入/data/research/bazaarvoice/data/review_nouns.txt -输出/data/research/bazaarvoice/data/review_nouns_
mallet
.<em
浏览 4
提问于2016-06-11
得票数 1
3
回答
保存
的
Gensim LdaMallet
模型
不能在不同
的
控制台中工作
、
、
、
我正在
训练
巨蟒
的
ldamallet
模型
并保存它。我还保存了培训字典,我
可以
用它为以后看不见
的
文档创建语料库。如果我在同一个控制台内执行每一个动作(即
训练
一个
模型
,保存经过
训练
的
模型
,加载保存
模型
,推断看不见
的
语料库),那么一切都
可以
正常工作。但是,我想在不同
的
控制台/计算机中使用经过
训练
的
模型
浏览 1
提问于2019-05-29
得票数 0
1
回答
Mallet
主题建模:删除最常见
的
单词
、
、
在艺术史领域,我刚接触过
Mallet
和主题造型。我正在使用
Mallet
2.0.8和命令行(我还不知道Java)。在
训练
模型
之前,我想删除最常见和最不常见
的
单词(在整个语料库中删除10次,如D.Mimno所建议
的
),因为结果并不干净(即使是在斯多普林医生那里),这并不令人惊讶。 我已经发现剪枝命令是有用
的
,有诸如prune -document之类
的
选项。是
对
的
吗
?还是以另一种方式存在?有人
可以
浏览 4
提问于2018-01-05
得票数 2
点击加载更多
相关
资讯
删除的照片可以恢复吗?
被删掉的历史浏览记录,可以恢复吗?
手机上如何直接恢复照片,是可以直接恢复的吗-恢复百科
硬盘里的东西误删怎么恢复?硬盘文件删除后可以恢复吗
猿力未来申请对用于解答数学题目的模型的训练方法及装置专利,提高模型训练效率
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券