在这种情况下,我不太清楚“潜在”指的是什么。
在基于维基百科的显式语义分析计算语义相关性,他们说
''Our semantic analysis is explicit in the sense that we manipulate
manifest concepts grounded in human cognition, rather than
'latent concepts' used by Latent Semantic Analysis''.
简单地说,这意味着什么?
我看了维基百科的相关文章( (wikipedia.org/wiki/Latent_semantic_analysis),wikipedia.org/wiki/Explicit_semantic_analysis) Latent
Explicit
),但我无法理解它的正面或反面。
也许更了解这里所涉及的细微差别的人也许能够向我清楚地指出这两种访问文档/文本片段与特定概念相关的方法的异同、利弊。
发布于 2015-05-14 13:41:48
不同之处在于,在ESA中,概念已经已知并被标记(因此,“显式概念”),而在LSA中,这些概念是潜在的(它们是未定义的,需要被发现)。
注意来自ESA维基百科页面的以下语句:
The name "explicit semantic analysis" contrasts with latent semantic analysis (LSA), because the use of a knowledge base makes it possible to assign human-readable labels to the concepts that make up the vector space.[3][1]
简言之,欧空局使用关于词汇和概念之间关系的先验知识(以及这些概念的标签),而LSA则不使用。
维基百科引用上述引文的参考资料:[1] Ofer Egozi, Shaul Markovitch and Evgeniy Gabrilovich (2011). "Concept-Based Information Retrieval using Explicit Semantic Analysis" (PDF). ACM Transactions on Information Systems 29 (2). Retrieved January 3, 2015.
[3] Gabrilovich, Evgeniy; Markovitch, Shaul (2007). Computing semantic relatedness using Wikipedia-based Explicit Semantic Analysis (PDF). Proc. 20th Int'l Joint Conf. on Artificial Intelligence (IJCAI). pp. 1606–1611.
https://datascience.stackexchange.com/questions/5793
复制相似问题