腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
MALLET
中
更改
主题
分发
文件
中
列
的
顺序
、
、
、
、
在
训练
主题
模型时,通过使用--output-doc-topics参数,
MALLET
生成一个以制表符分隔
的
文件
,其中包含每个文档
的
主题
分布。但是,我需要对此
文件
进行不同
的
排序,以便进一步处理。现在,
列
按
主题
权重降序排序(0.211...,0.133...等等)。但是否也可以按
主题
编号升序进行排序(0,1,2,...)以及它们相应
的
权重?最初,我认为可以使用Excel
浏览 7
提问于2017-03-17
得票数 0
回答已采纳
1
回答
IllegalArgumentExce错误:无法从
文件
complaints.
mallet
中
读取InstanceList
、
我试着用
Mallet
做一个研究项目,而且我一直
在
犯同样
的
错误。下面是我一直
在
使用
的
说明:步骤1:使用CAT扫描程序清除
文件
单击
浏览 3
提问于2017-07-13
得票数 1
1
回答
从训练模型-
MALLET
看
主题
权重
的
推断
我从一堆指定20个
主题
的
文本
中
训练了一个模型,但是当我
在
一个新文档上运行推理器时,它只输出10个
主题
权重。下面是我使用
的
命令: bin/
mallet
导入-
文件
-输入/data/research/bazaarvoice/data/review_nouns.txt -输出/data/research/bazaarvoice/data/revie
浏览 4
提问于2016-06-11
得票数 1
1
回答
如何用木槌提取
主题
词
、
、
我已经用
mallet
导入了
文件
,现在我想从导入
的
数据
中
建模
主题
,并将它们存储
在
文本
文件
中
,在那里我将能够读取这些
主题
。有人能帮助编写
主题
提取
的
命令吗?就像我在下面输入
的
主题
提取命令一样,但是它会抛出异常。bin\
mallet
导入-dir--输入D:\Data\test1 1--输出test1.
mallet
--保持
顺序<
浏览 1
提问于2015-11-03
得票数 1
回答已采纳
2
回答
主题
建模与
主题
相似性
的
发现
、
、
我需要应用
主题
建模来找到相似的文档,然后分析这些相似的文档,找出它们之间
的
不同之处。问:有谁能给我建议一个
主题
模型包,我可以通过它来实现这一点吗?我正在探索
Mallet
和Gensim Python。不知道哪一个最适合我
的
要求。 任何帮助都将不胜感激。
浏览 4
提问于2014-05-05
得票数 0
回答已采纳
1
回答
如何获得新文档
的
主题
向量,并与
Mallet
中
预定义
的
主题
模型进行比较?
、
、
我试图以某种方式比较单一文档
的
主题
分发
(使用LDA)和以前创建
的
主题
模型
中
的
其他
文件
及其
主题
分布(使用
MALLET
)。我知道这可以通过终端
中
的
MALLET
命令来完成,但我
在
找到用Java实现这一点
的
方法时遇到了问题。已经创建
的
主题</em
浏览 2
提问于2017-03-02
得票数 3
回答已采纳
1
回答
为什么
MALLET
LDA需要保持
顺序
?
、
、
、
在
MALLET
文档
中
,
主题
模型训练需要--keep-sequence标签(详情请参见:)感谢您阅读这篇文章。
浏览 1
提问于2015-03-13
得票数 2
4
回答
关于lda推断
、
、
现在,我正在使用
MALLET
包
中
的
LDA
主题
建模工具对我
的
文档进行一些
主题
检测。最初一切都很好,我从中得到了20个
主题
。然而,当我尝试使用该模型推断新文档时,结果有点令人费解。例如,我故意在手动创建
的
文档上运行我
的
模型,该文档只包含"FLU“
主题
之一
的
关键字,但我得到
的
每个
主题
的
主题
分布小于0.1。然后,我
在<
浏览 2
提问于2010-12-07
得票数 4
2
回答
Gensim
Mallet
包装器:如何获得所有文档
的
主题
权重?
、
、
、
、
我正在使用Gensim
的
Mallet
包装器进行
主题
建模- LdaMallet(path_to_
mallet
_binary, corpus=corpus, num_topics=100, id2word=words, workers=6, random_seed=2) 虽然上面的工作速度惊人地快,但获取每个文档(n=40,000)
的
主题
分布
的
步骤(见下文)花费了很长
的
时间。有没有一种方法可以更快地获得所有文档
的
主题
分布
浏览 37
提问于2020-06-13
得票数 0
1
回答
在
Mallet
中使用预定义
主题
、
、
我希望使用
Mallet
根据我定义
的
主题
对不同
的
文档进行分类。我知道
Mallet
将首先确定
主题
,然后对文档进行分类,但我想跳过第一步,因为我已经有了一个
主题
列表,其中包含与它们相关联
的
单词。有没有办法使用我创建
的
预定义
主题
列表来使用
Mallet
对文档进行分类? 任何指导都是值得感谢
的
。谢谢!
浏览 0
提问于2014-10-18
得票数 1
2
回答
null-
mallet
组合
文件
上
的
源
、
、
、
、
我
的
数据位于一个
文件
中
,所以我研究
mallet
文档如何构造这个单一
文件
。bin\<em
浏览 9
提问于2016-12-07
得票数 1
1
回答
基于
主题
建模
的
文档关联评分
、
、
、
、
我目前有一个使用
MALLET
()
的
经过训练
的
主题
模型,该模型基于大约80000篇新闻文章(这些文章都属于一个类别)。任何想法或帮助都是非常感谢
的
。谢谢!
浏览 2
提问于2018-07-23
得票数 2
回答已采纳
1
回答
使用
Mallet
Api for Java进行
主题
建模
、
、
您好,我必须使用
Mallet
Java API进行
主题
建模,但我对
Mallet
是个新手,所以我发现理解和使用
Mallet
库真的很难。有谁知道在哪里可以找到
主题
建模
的
源代码来理解这些库?
浏览 2
提问于2011-06-25
得票数 2
1
回答
Python ()方法生成java.io.FileNotFoundException
、
、
、
、
我对Python
中
的
子进程包很陌生。我试图使用该包
中
的
call()方法向终端发送以下命令: import os class
Mallet</
浏览 2
提问于2013-06-25
得票数 0
回答已采纳
1
回答
使用
主题
建模Java工具包
、
、
我正在研究文本分类,我想使用
主题
模型(LDA)。我
的
语料库
中
至少有24,000份波斯新闻
文件
。语料库
中
的
每个文档都是从新闻中提取
的
(关键字、权重)对
的
格式。我看到了两个Java工具包:
mallet
和lingpipe。我读过有关导入数据
的
mallet
教程,它以纯文本获取数据,而不是我所拥有的格式。我能改变它吗?此外,还阅读了一些关于林格管
的
内容,教程
中
的<
浏览 6
提问于2015-02-18
得票数 0
回答已采纳
1
回答
MALLET
中
主题
模型
的
增量式训练
、
根据
MALLET
,可以逐步地培训
主题
模型:
在
最后一个命
浏览 1
提问于2014-04-04
得票数 5
1
回答
Mallet
中
的
一致性和诊断
文件
、
、
在
Mallet
中
,我们可以获得一个诊断
文件
,包括测量每个
主题
的
一致性。
在
Gensim
中
,我们对每组
主题
有一个总分,对每个
主题
有一个单独
的
分数()。我有两个问题:2-如果我们想使用
Mallet
诊断
文
浏览 5
提问于2021-02-20
得票数 0
2
回答
基本使用。第一步
、
我试图
在
主题
建模等方面使用
Mallet
,没有任何解释。我
的
目的是获得我现在拥有的M文档
的
N个
主题
,将每个文档分类为一个或多个
主题
(doc 1=
主题
1;doc 2=
主题
2,可能还有
主题
3),并根据这个结果对未来
的
新文档进行分类。我第一次尝试使用bigartm,但是在这个程序
中
没有发现任何用于分类
的
东西,只有
主题
建模。所以
Mallet</em
浏览 0
提问于2016-11-14
得票数 2
回答已采纳
1
回答
如何处理
Mallet
中
cmd行
中
的
空格?
、
、
、
、
如果我
在
中
运行cmd
中
没有空格
的
路径,这是可以
的
。
Mallet
导入-dir--输入E:\
Mallet
\
mallet
-2.0.8RC3\sample-data\web\en -输出E:\
Mallet
\topicout\weben.
mallet
-保持
顺序
我将\n下面的
文件
复制到路径包含空格
的
另一个
文件
夹
中
。我在下面使用引号,但不起
浏览 2
提问于2019-03-09
得票数 1
回答已采纳
2
回答
将Python字符串传递给
Mallet
进行
主题
建模
、
、
、
、
我正在使用BeautifulSoup构建一个文本语料库,以及从HTML元数据
中
获取
的
一些元数据。如果我可以从Python内部调用
Mallet
,并让它从Python字符串而不是目录
中
的
文本
文件
对
主题
进行建模,那将是非常有帮助
的
。这样,我就可以将
Mallet
找到
的
n个关键字放入每个
文件
中
。("malletdir/
mallet
-2.0.7/
浏览 4
提问于2014-03-18
得票数 4
点击加载更多
相关
资讯
使用Python更改数据框中的指定列
顺序表数据结构在python中的应用
在Solidworks中如何更改默认的标准视图方向
OBJ文件在ZBrush中的操作
轻量化视频在重大主题报道中的运用
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券