腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3289)
视频
沙龙
1
回答
应用
(
余弦
)
相似性
度量
-
pandas
数据
帧
、
、
我有两个形状的熊猫
数据
框: df.shape (1,8) df1.shape (14,8) 我想用df1中的每一行计算df的cosine_similarity。以下是一些示例
数据
: ?
浏览 19
提问于2020-07-12
得票数 1
3
回答
sklearn.manifold中的
余弦
相似法
、
我有一个小问题要在我的
数据
集上执行TSNE,使用
余弦
相似性
。我计算了所有向量的
余弦
相似性
,所以我有一个包含
余弦
相似性
的方阵: [ 0.7 1 0.3 0.4 ]0.6,0.4,0.1,1]])Y = model.fit_transform(A) 但我不确定要使用预先计算
浏览 5
提问于2016-04-11
得票数 10
回答已采纳
3
回答
在KNN算法中,我能用
余弦
相似度作为距离
度量
吗?
、
、
KNN的大多数讨论都提到了欧几里德、曼哈顿和汉明距离,但它们没有提到
余弦
相似性
度量
。这有什么原因吗?
浏览 0
提问于2018-01-09
得票数 12
回答已采纳
5
回答
余弦
相似度与点积的距离
度量
看起来,两个特征的
余弦
相似性
仅仅是它们的点乘积,它们的大小的乘积。
余弦
相似性
是什么时候比点积更好的距离
度量
?也就是说,在不同的情况下,圆点乘积和
余弦
相似性
是否有不同的优缺点?
浏览 0
提问于2014-07-15
得票数 80
回答已采纳
2
回答
基于
相似性
度量
(例如,
余弦
相似性
等)对Holoviews热图的列和行进行重新排序。
、
、
、
、
假设我有一个
pandas
数据
帧
(随机示例),我可以得到一个带有Holoviews和Bokeh渲染器的热图: rownames = 'ABCDEFGHIJKLMNO' df = pd.DataFrame(
数据
(x和y)是分类的,因此行或列的初始顺序并不重要。我想根据一些
相似性
度量
对行/列进行排序。列和行已经根据相似度进行了排序(在本例中,基于点积的
余弦
;其他也可用,如“相关性”等)。 但是,我想在Holoviews中显示集群图。如何从海运矩阵
浏览 44
提问于2019-03-22
得票数 2
回答已采纳
2
回答
使用相同源的
余弦
相似和完全不同的结果
、
、
、
、
我正在学习单词嵌入和
余弦
相似性
。我的
数据
是由两组相同的词组成的,但用的是两种不同的语言。 现在
浏览 3
提问于2019-07-24
得票数 0
回答已采纳
2
回答
函数在R中的
数据
帧
列表中的
应用
、
、
、
我有一个
数据
帧
列表,每个
数据
帧
都有一个三维向量(3列)的行。我想计算每个
数据
帧
(例如,第1行和第2行、第2行和第3行、第3行、第3行和第4行等)的每一对后续行的
余弦
相似性
(lsa:: cosine )。我如何循环遍历列表中的每个
数据
帧
,以计算后续行的
余弦
相似性
,从而使每个
数据
帧
的
余弦
值保持分离?以下是一些可复制的容易伪造的<em
浏览 3
提问于2022-08-17
得票数 2
回答已采纳
1
回答
量化一个
数据
集到另一个
数据
集的差异量。
例如,如下图所示,左边是poincare映射
数据
集#1,右边是dataset #2。用什么最好的方法来量化右边和左边的差异?标准偏差在这里不会有多大帮助,因为这是两个独立的
数据
集。
浏览 0
提问于2020-03-02
得票数 2
回答已采纳
1
回答
余弦
相似度
pandas
数据
帧
解释
、
import numpy as np; import
pandas
as pd 我有这个样本代码来尝试获得
余弦
相似度,因为我的目标是让他们获得最相似的人,我想知道这是否适用于用作
相似性</em
浏览 0
提问于2018-03-21
得票数 0
1
回答
求出
余弦
相似性
后对数组进行重构
、
、
我有一个包含工作职业作为主要变量的
数据
框架,对于每个职业来说,这是一组组成一份工作的技能。我试图用
余弦
作为距离
度量
来寻找工件之间的
余弦
相似性
。到目前为止,我设法得到了
余弦
矩阵/数组,但是我不能把这个数组作为包含职业之间
相似性
的
数据
框架。请参见下面的
数据
集示例、我迄今使用的代码以及我希望得到的预期结果。
数据
集 INDEX 3D studio Accountancy C
浏览 2
提问于2018-08-06
得票数 1
回答已采纳
1
回答
相似阈值标准
、
当使用
相似性
度量
时(如。研究信息内容、
余弦
相似性
等)对于任何类型的
数据
,是否存在所使用的标准相似阈值,还是所有这些都取决于情况?
相似性
阈值是0,1中的值X,使得所有
相似性
分数大于X的对都是“连通的”,而相似度分数低于X的对则不是。
浏览 0
提问于2020-12-11
得票数 1
回答已采纳
1
回答
使用NetworkX根据相似度绘制节点间的边?
、
、
、
、
这是我的玩具节点dataframe: 'id': [1, 2, 3, 4, 5]for i, attr in df.set_index('id').iterrows():现在,我希望使用节点相似度(
余弦
函数或任何其他距离函数问题: 我可以用混合类型进行节点
相似性
,并为每种类型
应用
浏览 11
提问于2022-02-23
得票数 1
1
回答
欧几里德与
余弦
相似
、
、
、
、
我有一个文本
数据
集,我用tfidf技术矢量化,现在为了进行聚类分析,我正在测量这些向量表示之间的距离。我发现一种常用的方法是用
余弦
相似度来
度量
距离,当我问为什么不使用欧氏距离时,通常的回答是,当向量的大小不同时,
余弦
相似性
更好。由于我的文本矢量化表示是归一化的,我想知道使用
余弦
相似度比欧几里得距离来聚类我的
数据
的优点是什么?
浏览 0
提问于2018-04-11
得票数 2
回答已采纳
1
回答
ValueError:公制‘
余弦
’无效。使用sorted(sklearn.neighbors.VALID_METRICS['ball_tree'])
、
、
、
我试图使用
余弦
度量
与Ball_tree算法,因为我的
数据
是高维的。我不明白为什么我不能用
余弦
相似性
与球状树?
浏览 4
提问于2022-05-16
得票数 0
2
回答
如何在有新向量的预计算矩阵中求
余弦
相似度?
、
、
、
、
我的
数据
形状是(5000,2048),当我用滑雪板中的成对距离计算
余弦
矩阵时,得到了(5000,5000)矩阵。在这里我可以互相比较。但是现在,如果我有一个新的(1,2048)的向量形状,如何利用我已经计算过的(5000,5000)
余弦
矩阵,找到这个项目与我所拥有的早期
数据
的
余弦
相似性
?编辑 PS:,我可以将这个新向量附加到我的
数据
中,然后再计算
余弦
相似度。但对于大量的
数据
,它变得缓慢。或者还有其他快速和准确的距离
度量</em
浏览 7
提问于2019-11-26
得票数 0
1
回答
如何规范奇异值分解(SVD)在0到1之间的结果?
、
、
、
但是,我想将所有预处理
数据
在0到1之间规范化,因为我的所有
相似性
度量
(
余弦
、皮尔逊、欧几里得)都依赖于这个假设。编辑:如果输入矩阵没有0到1之间的值,我希望所有的
相似性
度量
都能给出0到1之间的结果,特别是我的归一化欧几里德距离。
浏览 0
提问于2014-06-26
得票数 6
2
回答
Mahout推荐的相似策略的差异
、
、
、
、
我使用的是mahout推荐算法。所有的相似类之间有什么不同?如何知道什么是我的申请的最佳选择?以下是我的选择:SIMILARITY_LOGLIKELIHOODSIMILARITY_CITY_BLOCKSIMILARITY_PEARSON_CORRELATION 这意味着什么?
浏览 7
提问于2014-04-28
得票数 2
回答已采纳
1
回答
判断两幅图像是否相似的最佳模型
我的
数据
集是成对的图像,评级为1或0。1表示相似,0表示不相似。模型必须以这样的方式进行训练,即它在训练中不存在的两个输入图像之间提供
相似性
。类的数量也是不确定的。我使用了ITML (信息理论
度量
学习)、LSML(最小二乘
度量
学习)和CSML (
余弦
相似
度量
学习)。因此,我将这个问题解释为
度量
学习问题。有没有其他方式来看待这个问题或我可以使用的任何其他
度量
学习模型?
浏览 0
提问于2017-05-29
得票数 0
2
回答
0与1的
余弦
相似性
、
、
、
、
我有兴趣计算向量之间的相似度,但是这种
相似性
必须是0到1之间的一个数字。关于tf-idf和
余弦
相似性
,都存在许多问题,都表明值在0到1之间。来自。model_b[word_b].reshape(1, -1) 但是sim是一个在-1,1范围内的
相似性
度量
直觉上我会认为是可以的,但我不确定这是否是关于
余弦
相似的实际意义的良好实
浏览 0
提问于2019-05-26
得票数 8
回答已采纳
1
回答
熊猫:在约束条件下对每一对列
应用
函数
、
、
正如标题所述,在某些条件下,我试图对dataframe的每一对列
应用
一个函数。我要试着说明这一点。我想在每一对列之间
应用
余弦
相似性
度量
--只有(编辑!)--如果其中一列的项之和大于5。 | [14,17] | [14,19] | [14,...|cs(17,19)..| ...如能提供任何帮助,将不胜感激:)
浏览 0
提问于2016-07-19
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
将多个Excel工作表合并到一个Pandas数据帧中
相似性与相关性度量
5分钟学习KNN 算法
余弦相似度算法进行客户流失分类预测
RUBER:一种无监督对话系统回复质量的评价方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券