腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
需要
具有
相同
大小
的
余弦
相似
向量
、
、
我想计算一个
需要
X,Y,Z技能
的
开放式职位与W,T,L级别的专业知识(熟练程度)和不同
的
员工之间
的
相似
性。但并不是所有的员工都有X,Y,Z技能,所以如果技能不存在,我们
需要
加一个0……我没有工作,因为当角色和员工都有技能时,我只是匹配。有什么想法吗?
浏览 3
提问于2017-02-20
得票数 0
1
回答
( model.docvecs.similarity_unseen_docs(document_1,document_2获得负分数)
、
、
、
我试图找出两个文档,即'document_1‘和'document_2’之间
的
相似
性。我正在使用Doc2Vec Gensim
的
来寻找
相似
性评分。score = model.docvecs.similarity_unseen_docs(trainedModel, document_1, document_2)分数为负值
的
地方这里,document_1和document_2是NLTK
的
word_tokenize()
的
结果。 当
浏览 2
提问于2019-11-15
得票数 0
1
回答
在word2vec中,彼此是标量倍数
的
词
向量
之间
的
语义关系是什么?
、
、
、
、
假设您有一个单词
向量
,表示单词queen。根据最
相似
单词
的
投影权重
向量
的
简单平均值和
向量
皇后+皇后之间
的
余弦
相似
性,将x视为与
向量
皇后+皇后最
相似
的单词。 用同样
的
方法认为y是与
向量
皇后+皇后+皇后最
相似
的词。那么x、y和queen这三个词之间
的
语义关系是什么呢?我知道这些
向量
在
向量
内
浏览 0
提问于2018-07-31
得票数 1
回答已采纳
2
回答
创建给定
余弦
相似
度
的
随机
向量
、
、
给出一些
向量
v,我想得到另一个随机
向量
w,v和w之间有一些
余弦
相似
性,有没有办法在python中得到这个? 示例:为了简单起见,我将使用v3,-4
的
2D
向量
。我想得到
余弦
相似
度为60%或+ 0.6
的
随机
向量
w。这应该生成
具有
值0.875、3
的
向量
w或
具有
相同
余弦
相似
度
的
任何其
浏览 48
提问于2018-10-21
得票数 2
回答已采纳
1
回答
创建
相似
矩阵
、
、
、
我有一个训练集和一个
向量
测试集。所有的
向量
都有标记。我用
余弦
距离来计算
向量
中元素之间
的
相似
性。在图中,我们可以看到在测试集
的
6个
向量
和训练集
的
18个
向量
的
子集中应用
余弦
距离
相似
性
的</
浏览 0
提问于2017-09-15
得票数 1
回答已采纳
1
回答
tf-以色列国防军不同长度
的
文件
、
、
、
当文档长度非常不同时(例如,文档长度从500字到2500字不等),我搜索了关于规范tf等级
的
网页。 我发现
的
唯一
的
规范化讨论是将术语频率除以文档
的
长度,从而导致文档
的
长度没有任何意义。但是,这种方法对tf
的
规范化来说是非常糟糕
的
方法。如果有的话,这会导致每个文档
的
tf等级有很大
的
偏差(除非所有文档都是从几乎
相同
的
字典中构造
的
,而使用tf-国防军时则不是这样)。例如,让我们拿两个文件
浏览 2
提问于2016-09-26
得票数 10
回答已采纳
1
回答
在没有方向
的
情况下,如何利用文档特征
向量
上
的
余弦
相似
度公式?
、
在数学中,
向量
具有
大小
和方向。然而,
余弦
公式仅适用于
向量
。对于表示为
向量
的
文档,方向在哪里?
浏览 0
提问于2020-05-17
得票数 1
1
回答
句子嵌入之间
的
余弦
相似
性总是正
的
。
、
、
我有一份文件清单,我正在寻找( a)副本;( b)非常
相似
的文件。为此,我将采取以下行动:计算
向量
嵌入之间
的
余弦
相似
度(下面的代码)。我得到
的
所有
余弦
相似
值都在0到1之间,为什么呢?我不应该也有负值因为
相似
值吗?句子嵌入既有积极因素,也有消极因素。
浏览 0
提问于2021-09-07
得票数 4
回答已采纳
2
回答
为什么在计算
向量
相似
性时使用
余弦
相似
度而不是缩放
向量
?
、
、
、
讨论如何计算两个
向量
的
相似
性。首先讨论了欧氏距离
的
计算,然后讨论了
余弦
相似
度。它说,当语料库
的
大小
不同时,
余弦
相似
性更有意义。这实际上是与给在这里
相同
的
解释。但是,我不明白为什么我们不能根据语料库
的
大小
来缩放
向量
。例如,在链接问题
的
示例中: 用户2购买了100倍鸡蛋、1
浏览 0
提问于2022-09-13
得票数 12
回答已采纳
5
回答
余弦
相似
度与点积
的
距离度量
看起来,两个特征
的
余弦
相似
性仅仅是它们
的
点乘积,它们
的
大小
的
乘积。
余弦
相似
性是什么时候比点积更好
的
距离度量?也就是说,在不同
的
情况下,圆点乘积和
余弦
相似
性是否有不同
的
优缺点?
浏览 0
提问于2014-07-15
得票数 80
回答已采纳
2
回答
以欧氏距离为距离度量
的
暹罗模型能在推理过程中使用
余弦
相似
性吗?
、
、
、
、
如果我有3个嵌入Anchor, Positive, Negative从一个暹罗模型训练欧几里得距离作为三重子损失
的
距离度量。 在推理过程中可以使用
余弦
相似
度吗?我注意到,如果用A,P,N模型计算欧氏距离,结果在大多数情况下似乎与匹配图像
的
距离变小,而非匹配图像
的
距离更大是一致
的
。如果我在上面的嵌入中使用
余弦
相似
性,我无法区分(A, P)和(A, N)之间
的
相似
值,或者对于不同
的
图像,一个值似乎更高,
浏览 0
提问于2022-02-16
得票数 1
1
回答
项目间
的
余弦
相似
性(购买数据)与标准化
、
、
、
我使用表示产品用户购买行为
的
IndexedRowMatrix,为了构建产品推荐,我使用
余弦
相似
度来计算产品之间
的
相似
性。PySpark提供了一个名为columnSimilarities()
的
函数。我
的
问题是,在使用columnSimilarities()之前,是否
需要
规范每个产品
的
向量
?我读过关于归一化和
余弦
相似
的文章,并且理解
余弦
相似
已经对<e
浏览 0
提问于2018-11-19
得票数 3
1
回答
基于COLT
的
两个语义
向量
的
相似
性度量
、
、
、
我正在使用传播激活来获得与给定概念相关
的
概念。如果我想计算“伦敦”和“巴黎”之间
的
相似
度,我会得到两个
向量
,如下所示:Paris : 1.0Capital : 0.7 France问题是
向量
可以有不同
的
长度。在这种情况下,可以使用什么
相似
性度量?据我所知,
余弦
测度只能应用于
具有
相同
大小
的
向
浏览 5
提问于2011-04-14
得票数 0
1
回答
为什么用
余弦
距离来度量词嵌入之间
的
相似
性?
、
、
在计算单词之间
的
相似
度时,cosine
相似
度或距离是在字
向量
上计算
的
。为什么其他
的
距离度量,如欧几里德距离,不适合这个任务。 让我们考虑两个
向量
a和b。其中,a = [-1,2,-3]和b = [-3,6,-9],这里
的
b = 3*a,也就是,这两个
向量
有
相同
的
方向,但
大小
不同。a和b
的
余弦
相似
性为1,表明它们是一致
的<
浏览 0
提问于2020-09-03
得票数 9
回答已采纳
1
回答
用word2vec,doc2vec计算两个文档之间
的
相似
度
、
、
、
、
我正在试图计算两个文档之间
的
相似
性,这两个文档由数千个句子组成。但是,我想捕捉文档之间更多
的
语义差异。因此,我通过简单地平均每个文档中
的
所有单词
向量
,生成文档
向量
,并度量这些文档
向量
之间
的
余弦
相似
度,从而构建了文档嵌入和计算文档
相似
度。然而,由于每个输入文档
的
大小
相当大,我使用上述方法得到
浏览 0
提问于2018-11-25
得票数 2
回答已采纳
2
回答
如何在有新
向量
的
预计算矩阵中求
余弦
相似
度?
、
、
、
、
我有一个包含5000项(行)和2048个特性(列)
的
dataframe。PS:,我可以将这个新
向量</
浏览 7
提问于2019-11-26
得票数 0
2
回答
基于矩阵乘法
的
文档检索
、
、
我有一个模型,它表示多维
向量
空间中
的
文档集合。例如,对于100 k文档,我
的
模型以300维
向量
的
形式表示它们。最后,我得到了一个
大小
为[100K, 300]
的
矩阵。为了根据给定查询
的
相关性检索这些文档,我执行矩阵乘法。例如,我将给定
的
查询表示为[300, 1]。然后,利用矩阵乘法得到
余弦
相似
度分数如下:[100K, 300]*[300, 1] = [100K, 1]。现在,如何从这个
具有</
浏览 4
提问于2020-05-14
得票数 0
回答已采纳
1
回答
当我使用
余弦
相似
度时,为什么我得到
的
邓恩指数是负值?
、
、
、
我使用了不同
的
相似
度矩阵,如欧几里得、曼哈顿和
余弦
,当我使用
余弦
相似
度时,Dunn指数为负值。我读到过邓恩指数
的
取值范围从0到无穷大。使用
余弦
相似
度计算Dunn指数是正确
的
吗?
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
1
回答
用java程序计算
余弦
相似
度
、
、
我有一个问题,要计算一个
相似
性度量,为我
的
最终项目开发一个搜索引擎。我有自己
的
数据库,里面有811份文件。
浏览 3
提问于2011-03-28
得票数 0
1
回答
在巨大
向量
上执行
余弦
相似
时获得内存错误
、
、
、
、
我试图建立一个基于内容
的
推荐系统,使用包字模型。下面的教程使用
大小
向量
( 4000 , 5000 )上
的
sklearn库
的
余弦
相似
性,其中4000是dataset中
的
行数,5000是特性
的
数量。contain all the tags (eg: location, genre) based on which recommendation will be performed 但是,当我试图在另一个
具有
94955行<em
浏览 9
提问于2022-09-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
NLP中的嵌入和距离度量
OpenCV特征提取与图像检索实现
一文教你如何正确利用kNN进行机器学习
5分钟学习KNN 算法
机器学习基础:相似度和距离度量究竟是什么
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券