腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
词对
余弦
相似
度
差异的统计意义
nlp
我想知道是否有什么方法可以说明从
语言
模型中提取的词对的
余弦
相似
度
差异的统计意义。假设我有一对A-B,和对A-
C
。我使用word2vec或bert (或其他任何)嵌入来计算A的
余弦
相似
度
,假设我得到了.60。我对A也是这样做的,比方说产生.62。现在,.60和.62之间的差异在统计学上是显著的吗?但直觉上,我认为我需要知道
余弦
相似
度
的计算有多少次是基于的(即A、B和
C
项在嵌入的语料库
浏览 0
提问于2022-10-20
得票数 0
1
回答
将
余弦
相似
性转换为概率
nlp
、
cosine-distance
在自然
语言
处理中,常用
余弦
相似
度
来计算两个词之间的
相似
度
。它在-1,1之间有界。据推测,1表示完全
相似
,-1表示类似反义词,0表示单词之间没有关系,尽管我不确定这在实践中是否完全成立。对于另一个应用程序,我需要将
余弦
相似
性转换为0到1之间的概率。一个简单的解决方案是取
余弦
相似
性的绝对值,但这是否有意义?
浏览 0
提问于2023-03-17
得票数 1
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
python
、
text
、
gensim
、
sentence-similarity
我使用Gensim库来查找句子与段落集合、文本数据集之间的
相似
之处。分别使用了
余弦
相似
度
、软
余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于
余弦
相似
度
和软
余弦
相似
度
,我猜
相似
度
是向量之间的
余弦
。我说的对吗? 在Gensim文档中,他们写道,这是语义的关联
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
2
回答
使用相同源的
余弦
相似
和完全不同的结果
python
、
machine-learning
、
cosine-similarity
、
word-embedding
、
machine-translation
我正在学习单词嵌入和
余弦
相似
性。我的数据是由两组相同的词组成的,但用的是两种不同的
语言
。 我是否应该期望获得同样的结果?我注意到有时我有两个相反的结果。因为我是新来的,所以我想弄清楚我是否做错了什么,或者背后是否有解释。根据我所读到的,软
余弦
<em
浏览 3
提问于2019-07-24
得票数 0
回答已采纳
1
回答
如何对HAC中具有相同
余弦
相似
度
的对象进行聚类
python-2.7
、
cluster-analysis
、
hierarchical-clustering
、
cosine-similarity
我想将对象A与对象B或对象
C
聚类,但对象A与对象B的
余弦
相似
度
为0,对象A与对象
C
的
余弦
相似
度
为0。在直接聚类之前,我需要一步一步地对这些对象进行聚类,哪个应该是第一个对象A与B或对象A与
C
的组合?
浏览 0
提问于2018-06-22
得票数 0
1
回答
生成两个具有给定角度的向量
math
、
vector
、
linear-algebra
、
cosine-similarity
我试图用给定的
余弦
相似
度
生成两个向量。输入将是
余弦
相似
度
的程度(或者说它取决于它)和向量中的维数(D),输出将是D维的两个向量,与它们之间给定的
相似
度
,现在我知道如何使用
余弦
相似
函数来计算
相似
度
,但当我尝试相反的方法时,我迷失了方向。
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
1
回答
如何在MALLET中获取两个文档之间的
余弦
相似
度
?
java
、
modeling
、
lda
、
mallet
我有一个使用MALLET训练的LDA主题模型,但是我想计算两个文档之间的
余弦
相似
度
来获得
相似
度
,但是我不确定我要计算哪个文件的
余弦
。我的
余弦
相似
度
函数运行得很好,但我不确定我在MALLET中比较的是什么。 任何帮助都将不胜感激!
浏览 1
提问于2017-04-07
得票数 0
1
回答
当我使用
余弦
相似
度
时,为什么我得到的邓恩指数是负值?
matlab
、
cluster-analysis
、
distance
、
cosine-similarity
我使用了不同的
相似
度
矩阵,如欧几里得、曼哈顿和
余弦
,当我使用
余弦
相似
度
时,Dunn指数为负值。我读到过邓恩指数的取值范围从0到无穷大。使用
余弦
相似
度
计算Dunn指数是正确的吗?
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
2
回答
我可以获得Word2Vec和Doc2Vec矩阵来计算
余弦
相似
度
吗?
python
、
gensim
、
word2vec
、
doc2vec
在我目前的大部分分析中,我一直在使用R中的tm包,但为了更进一步,我已经开始使用Python
语言
中的gensim库。 我不清楚我是否有像TF和TF-IDF中那样的词嵌入。我希望使用Word2Vec/Doc2Vec,并获得一个类似于我目前拥有的矩阵,然后计算文档之间的
余弦
相似
度
。这是模型的输出之一吗?我基本上有大约6000个文档,我想计算它们之间的
余弦
相似
度
,然后对这些
余弦
相似
度
得分进行排名。
浏览 3
提问于2019-07-11
得票数 0
1
回答
Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)
elasticsearch
我使用elasticsearch来组合不同的东西:-基于密集向量(
余弦
相似
度
)的文本得分搜索。我的问题是,在查询阶段不计算
余弦
相似
度
,我在文本中的搜索充当预筛选器。我将始终获得结果链接到文本搜索,即使
余弦
相似
更好。我想在查询时计算
余弦
相似
度</em
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
2
回答
可以仅使用非空值在行之间使用
余弦
相似
性吗?
python
、
pandas
、
trigonometry
我想要找到一个查询行和另外10个行之间的
余弦
相似
度
(或者欧几里得距离,如果更容易)。这些行都是nan值,因此如果列是nan,则忽略它们。例如,查询:3 2 NaN 5 NaN 4A B
C
D E F1因此,我只想得到查询的每个非空列与df列中的行之间的
余弦
相似
性。因此,对于df中的第0行,B和F在查询和df中都是非空的。 然后,我想打
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
1
回答
我们如何计算由评级表示的两个项目的调整后的
余弦
相似
度
?
recommendation-engine
、
mahout-recommender
、
collaborative-filtering
、
cosine-similarity
我想分别为a和b表示的两个项目计算调整后的
余弦
相似
值。我们取两个向量a={2,3,1,0}和b={1,0,4,2}。我知道
余弦
相似
度
是如何工作的,但我坚持使用调整后的
余弦
相似
度
方法。
浏览 4
提问于2016-02-18
得票数 0
2
回答
如何用两个矩阵计算
余弦
相似
度
matlab
、
matrix
、
cosine-similarity
实际上,它们是向量的集合-- A中的行向量,B中的列向量,我想为每对a和b获得
余弦
相似
度
,其中a是矩阵A的向量(行),b是矩阵B的向量(列)。 然而,要获得
余弦
相似
度
分数,需要将每个值
C
(i,j)除以两个对应向量的范数。你能在Matlab中提出最简单的方法吗?
浏览 8
提问于2013-01-15
得票数 6
回答已采纳
1
回答
文档
相似
性-多个文档以相同的
相似
性评分结束
nlp
我一直在处理一个业务问题,需要找到与现有文档
相似
的新文档。我使用了如下各种方法2.TFIDF +
余弦
相似
他们都没有像预期的那样工作。最后,我发现了一种更好的方法-- Word2vec +软
余弦
相似
性。 但新的挑战是,我最终得到了具有相同
相似
性评分的多个文档。它们大多是相关的,但很少有,即使有一些语义
相似
浏览 1
提问于2020-04-16
得票数 0
1
回答
归一化基于tf-idf计算的
余弦
相似
度
值
python
、
normalization
、
tf-idf
、
cosine-similarity
我计算基于
余弦
相似
度
的tf-idf矩阵:sim_desc = cosine_similarity(tfidf_matrix_desc) 但是,sim_desc包含的
相似
度
大于在这种情况下,我需要对
余弦
相似
性得分进行归
浏览 4
提问于2016-06-14
得票数 0
3
回答
最佳简历,文档匹配
scikit-learn
、
nltk
、
information-retrieval
、
tf-idf
、
gensim
我使用NLTK进行关键字提取,然后用RAKE进行关键字/关键字打分,然后使用
余弦
相似
度
。 用于关键词提取、tf和
余弦
相似
度
计算的Scikit。Gensim库采用LSA/LSI模型提取关键词,计算文档与查询之间的
余弦
相似
度
。
浏览 4
提问于2016-11-02
得票数 1
1
回答
文档
相似
度
的不同方法(LDA、LSA、
余弦
)
text
、
similarity
、
lda
、
trigonometry
、
lsa
我使用了三种不同的文档
相似
度
方法:- tfidf矩阵上的简单
余弦
相似
度
-在整个语料库上应用LDA,然后使用LDA模型为每个文档创建向量,然后应用
余弦
相似
度
。对整个语料库进行-applying LSA,然后使用LSA模型为每个文档创建向量,然后应用
余弦
相似
度
。基于实验,我在没有任何LDA或LSA的情况下,在tfidf矩阵上的简单
余弦
相似
度上得到了更好的结果。根据我所
浏览 20
提问于2017-01-06
得票数 0
1
回答
计算
余弦
相似
度
并在R中创建图
r
、
graph
、
cosine-similarity
我有这样的数据集: x <-
c
(1,4,6,8,0,5)z<-
c
(3,5,23,51,3,15) t<-
c
(14,14,23,4,16,17) 注意:实际上我有我想自动计算所有矢量之间的
余弦
相似
度
,然后创建这些矢量的网络(每个矢量将与所有其他矢量连接),其中桥的大小取决于
余弦
相似
度
的值。我希望我已经解释清楚了,谢谢
浏览 63
提问于2021-05-04
得票数 1
1
回答
在没有方向的情况下,如何利用文档特征向量上的
余弦
相似
度
公式?
classification
、
vector-space-models
在数据科学中,为了识别文档的
相似
性,我们将文档转换为特征向量。然后应用源文档与目标文档特征向量之间的
余弦
角公式。 然而,
余弦
公式仅适用于向量。一个矢量应该有两个震级和方向。
浏览 0
提问于2020-05-17
得票数 1
1
回答
关于word2vec most_similar()函数
text-mining
、
gensim
、
word2vec
我使用如下的most_similar()方法来获取与给定单词
相似
的所有单词:AFAIK,它的作用是计算给定单词和字典中所有其他单词之间的
余弦
相似
度
。另外,如果它使用
余弦
相似
度
,它是如何得到负值的?对于两个文档,
余弦
相似
度
在0-1之间变化。
浏览 2
提问于2016-01-19
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
余弦相似度算法进行客户流失分类预测
循环神经网络(三)——词嵌入学习与余弦相似度
C语言荣获2019年度编程语言
自然语言处理中句子相似度计算的几种方法
C 语言问鼎2017年度编程语言
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券