腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
潜在
语义
分析
确定
正确
的
主题
数量
python
、
scikit-learn
、
nlp
、
topic-modeling
、
svd
TruncatedSVD(n_components=2) lsa = svd.fit_transform(bag_of_words) 我想知道(也许在scikit-learn中)是否有一种方法可以选择最合适
的
主题
数量
在我
的
具体案例中,我选择了2个
主题
(任意),但我想了解Python中是否有一种方法可以推广到更大
的
案例(具有更多
的
文档和更多
的
单词),并自动选择
主题
的
数量
。 谢谢你
的
帮
浏览 53
提问于2021-09-07
得票数 1
回答已采纳
2
回答
主题
建模中
的
LSA、LDA或NMF?
nlp
我正试图通过Python & NLP实现
主题
建模,但无法
确定
我应该
使用
哪种算法。我研究过
潜在
语义
分析
(LSA)、
潜在
Dirichlet分配(LDA)和非负矩阵因式分解(NMF),但是如何
确定
哪一种算法最适合于特定任务?如果我只是连续地尝试所有这些,那么如何衡量结果呢?
浏览 0
提问于2020-06-19
得票数 2
2
回答
字数有限
的
语篇摘要
nlp
、
automatic-summarization
我正在回顾总结技巧,但还没有找到限制摘要长度
的
方法。例如,一个总结函数,它给我一个总结,即< 500 words。感谢你
的
回复!
浏览 0
提问于2019-12-25
得票数 1
回答已采纳
1
回答
只有24个文档
的
主题
建模给出了任意K
的
相同“
主题
”
topic-model
、
lda
、
gensim
、
lsi
我
的
文本预处理管道是一个通用
的
管道,包括标点符号删除、英语缩略语
的
扩展、停止词
的
删除和标记化。发行: 对于任意
数量
的
主题
K(我尝试过很多,例如10、50、100、
浏览 0
提问于2020-01-11
得票数 2
2
回答
潜在
语义
索引
主题
的
数量
topic-modeling
、
gensim
、
latent-semantic-indexing
我正在
使用
gensim
的
包在语料库上实现LSI。我
的
目标是找出语料库中出现频率最高
的
不同
主题
。如果我不知道语料库中
的
主题
数量
(我估计在5到20之间),那么设置LSI应该搜索
的
主题
数量
的
最佳方法是什么?是查找大量
的
主题
(20-30个),还是查找少量
的
主题
(~5个)?
浏览 8
提问于2014-07-18
得票数 1
1
回答
如何
确定
潜在
语义
分析
的
维度数?
java
、
theory
、
svd
、
lsa
、
latent-semantic-indexing
我最近一直在做
潜在
的
语义
分析
。我已经通过
使用
Jama包在java中实现了它。} results = result.getArray() ; 但是我们如何
确定
维度
的
数量
呢是否有一种方法来
确定
系统应该减少
的
维数以获得最佳
的
结果?对于LSA
的
有效性能,我们还考虑了哪
浏览 1
提问于2012-03-06
得票数 10
1
回答
概率
潜在
语义
分析
R
r
、
semantics
、
analysis
是否有支持R
的
概率
潜在
语义
分析
的
包?我找到了LSA包,但是有专门执行pLSA
的
包吗?谢谢。
浏览 0
提问于2012-08-18
得票数 0
回答已采纳
2
回答
将论坛讨论整理成分类文章或信息
的
算法/方法?
java
、
data-mining
、
text-mining
我正在为网络设计和编码一个基于知识
的
社区共享系统(论坛,问答,学生,教授和专家之间
的
文章共享)。我需要
使用
一些数据挖掘/文本处理技术/算法来
分析
专家和学生之间
的
讨论(讨论
使用
标签进行分类),并在特定
的
类似
主题
上创建适当
的
笔记和汇编。 对于这样
的
算法或可用
的
工具,我不是专家。
浏览 2
提问于2011-11-28
得票数 0
回答已采纳
1
回答
基于k均值
的
图像特征
的
潜在
语义
分析
dimensionality-reduction
我已经从一组图像中提取了颜色矩,并希望
使用
Kmeans进行维数约简,并找到顶层k个
潜在
语义
。如何
使用
Kmeans进行
潜在
的
语义
分析
?
浏览 0
提问于2021-10-22
得票数 0
回答已采纳
1
回答
潜在
语义
分析
在
主题
发现中
的
应用
algorithm
、
svd
、
gensim
我正在学习
潜在
语义
分析
(LSA),并且能够构造术语文档矩阵并找到它
的
SVD分解。我怎样才能从分解中得到
主题
?
浏览 1
提问于2014-01-29
得票数 2
回答已采纳
1
回答
将文档转化为向量空间表示,如何生成字典?
machine-learning
、
nlp
我有大量
的
非结构化文本文档,对于每个文档,我想要一个向量空间表示,这样我就可以很容易地将文档分类并进行
语义
性质
分析
。将文档转换到向量空间
的
方法有很多种,如词袋(BOW)模型、
潜在
语义
分析
(LSA)模型、n- gram模型等。但我认为所有这些方法都需要一个关键字字典。(不
确定
)但是如果没有查询,如何为大量文档生成字典?(100万)如何
确定
文档中
的
重要单词?
浏览 2
提问于2015-04-28
得票数 0
1
回答
文档中词
的
无监督聚类
python
、
cluster-analysis
、
semantics
、
wordnet
、
gensim
我想根据单词
的
语义
相似性对它们进行聚类。目前,我有一份文件清单,里面有检测到
的
名词短语。我想把这些获得
的
名词集中在文档中,然后在
语义
上不受监管地对它们进行聚类? 我看过wordnet和gensim库。有什么建议能真正帮助根据
语义
相似性来获得所需
的
词群呢?
浏览 5
提问于2014-01-28
得票数 2
回答已采纳
4
回答
LSA -
潜在
语义
分析
-如何在PHP中编码?
php
、
tagging
、
semantics
、
linguistics
、
lsa
我希望在PHP中实现
潜在
语义
分析
(LSA),以便找到文本
的
主题
/标记。我不想
使用
任何外部库。。从给定
的
文本中提取所有单词。 建立一个矩阵:列是数据库中
的
一些文档(越多越好?),行都是唯一
浏览 1
提问于2009-06-18
得票数 9
回答已采纳
1
回答
利用词
的
相似度发现概念
nlp
我已经给出了单词相似度矩阵,我想形成一个概念,作为单词
的
加权和。解决这个问题
的
正确
方法是什么?
潜在
语义
分析
在这里有用吗?
浏览 1
提问于2015-04-19
得票数 0
1
回答
选择合适
的
聚类方法进行
潜在
语义
分析
cluster-analysis
、
latent-semantic-indexing
、
latent-semantic-analysis
我想对一些文本文档进行聚类,以找到具有相同概念
的
文档。我已经
使用
潜在
语义
分析
(LSA)进行了
语义
相似性
分析
,但我搞不清应该选择哪种聚类方法来实现我
的
目的。谢谢
浏览 1
提问于2015-06-19
得票数 0
1
回答
大型稀疏矩阵奇异值分解
的
Java实现
java
、
text-mining
、
large-data-volumes
、
large-data
我想知道有没有人知道大型稀疏矩阵
的
奇异值分解(SVD)
的
java实现?我需要这个实现来进行
潜在
语义
分析
(LSA)。我尝试了来自UJMP和JAMA
的
包,但当行>= 1000和列>= 500
的
数量
时,它们卡住了。如果有人能给我指点psuedocode或其他东西,我将不胜感激。
浏览 1
提问于2011-07-26
得票数 7
1
回答
(初学者)NLP:我正在尝试理解如何对文本中
的
单词进行分类,以识别与某个
主题
相关
的
所有单词
python
、
list
、
text
、
nlp
、
natural-language-processing
我已经用BeautifulSoup抓取了一个网站,现在我想
分析
我抓取
的
所有文本,并创建一个出现在这段文本中
的
食品
的
长长列表。示例文本 如果你是一个素食主义者,并且一直在抱怨你不能吃云吞,那么这些家伙就是为你准备
的
!馅料是用坚硬
的
豆腐屑简单混合而成
的
,用盐、姜粉、白胡椒和大葱调味。这非常简单,但是非常令人满意。这些云吞最好
的
地方是馅料完全煮熟了,所以你可以通过品尝来调整调味料。只要确保馅料比你自己吃
的
时候稍微更咸点就行了。云吞皮没有太多
浏览 67
提问于2019-02-04
得票数 1
1
回答
语法与
语义
分析
compiler-construction
、
grammar
、
semantic-analysis
我想知道语法规范和
语义
分析
之间
的
界限在哪里。哪个更好:
使用
详细
的
语法描述还是将细节留到
语义
阶段?例如:设想一种像C#这样
的
具有枚举类型
的
OO语言,它可以从原始类型“派生”现在,枚举
的
基本类型
的
正确
性(在这种情况下:原始类型还是非原始类型)应该是语法检查或
语义
分析
的
主题
吗
浏览 3
提问于2010-08-13
得票数 3
回答已采纳
2
回答
潜在
特征
的
意义?
machine-learning
、
data-mining
、
recommender-system
我正在学习推荐系统
的
矩阵因式分解,我看到术语latent features发生得太频繁了,但我无法理解它
的
含义。我知道什么是特征,但我不理解
潜在
特征
的
概念。能解释一下吗?或者至少带我到一个我可以读到它
的
报纸/地方?
浏览 0
提问于2014-07-16
得票数 37
1
回答
Clang中
的
语义
分析
步骤是编译器
的
重要组成部分吗?
compiler-construction
、
clang
、
semantic-analysis
我正在尝试理解Clang
的
细节,但我对"Sema“库不是很
确定
。
语义
分析
是在编译器编译程序
的
过程中进行
的
吗?或者它只被程序员用来
分析
他/她
的
代码?据我所知,解析器构建一个AST,然后有"AST
使用
者“
使用
AST来做不同
的
事情。因此,代码生成库将AST转换为IR。
语义
分析
库
使用
AST对代码进行
分析
。这
浏览 0
提问于2012-07-17
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据探析期刊文章研究热点
您没有衡量的最重要的营销指标
机器学习-话题模型
文本挖掘入门课:主题模型让文本数据处理更幸福
小标签有大用处,使用Instagram标签提升品牌曝光度的技巧
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券