两个不同DataFrame的列之间的余弦相似性_Spark dataframe中列之间的余弦相似度_为什么两个向量之间的余弦相似性是负的？ - 腾讯云开发者社区

、、、、

我有一个张量'input_sentence_embed‘，形状为torch.Size(1768) INCIDENT_NUMBER‘和'matched_df’的每一行之间的欧几里德/余弦相似性。如果它们是标量值，我可以很容易地将'input_sentence_embed‘作为'matched_df’中的一个新列广播，然后找到两

浏览 0提问于2021-05-23得票数 0

回答已采纳

1回答

如何比较三个预先训练过的模型的余弦相似性？

、、、、

我有两个语料库--一个是所有女性领袖的演讲，另一个是男性领袖演讲。我想检验一个语料库中两个词之间的余弦相似性与另一个语料库中相同的两个词之间的余弦相似性是显著不同的假设。这样的t检验(或等效的)逻辑和可能吗？此外，如果两个语料库之间的<e

浏览 3提问于2020-05-11得票数 0

回答已采纳

1回答

熊猫:在约束条件下对每一对列应用函数

、、

正如标题所述，在某些条件下，我试图对dataframe的每一对列应用一个函数。我要试着说明这一点。我的df的形式如下：w1 | 0 | 5 | 3 | ... w2 | 2 | 5 | 4该代码对应于矩形网格中确定的位置，而ws是不同的单词。我想在每一对列之间应用余弦相似性度

浏览 0提问于2016-07-19得票数 3

回答已采纳

1回答

用python中的lambda替换嵌套的'for loop‘

、、

我正在处理一项任务，需要检查两个dataframe列之间的余弦相似性。我使用两个for循环分别迭代data1和data2的两列。在检查余弦相似度之后，我还在做其他的操作。

浏览 21提问于2021-08-03得票数 0

5回答

余弦相似性与Levenshtein距离

、、、

我想知道他们之间的区别是什么，在什么情况下他们工作得最好？余弦相似是度量内积空间中两个非零向量之间相似性的度量，它度量了它们之间夹角的余弦。0°的余弦为1，对于(0，π)半径的任意角度都小于1。列文希廷距离是一个用于测量两个序列之间差异的字符串度量。非正式

浏览 0提问于2019-11-18得票数 5

回答已采纳

3回答

Scala星火中两个稀疏向量的余弦相似性

、、

我有一个有两个列的dataframe，其中每一行都有一个稀疏向量。我试图找到一种适当的方法来计算每一行中两个向量的余弦相似性(或仅仅是点积)。创建一个k×n矩阵，其中n个项被描述为k维向量.要将每一项表示为k维向量，可以使用ALS表示潜在因子空间中的每个实体。这个空间(k)的维数可以由你来选择。使用colum

浏览 1提问于2018-12-15得票数 2

1回答

两个不同DataFrame的列之间的余弦相似性

、、、、

我想计算两个DataFrame之间的余弦相似度(对于不同的大小)，并将结果存储在新数据中。

浏览 72提问于2021-08-02得票数 0

1回答

余弦相似-缺点作为推荐引擎？

、、、、

我见过在K-最近邻算法中使用余弦相似性来生成基于用户偏好的推荐。在这些模型中，将给定产品的用户等级作为向量，然后由两个向量之间的余弦相似度来确定两个用户之间的相似度。在我看来，有两个用户可以拥有完全极高的评级偏好，但如果他们有平行(但不同的)偏好，那么就会生成一个余弦相似度为1。例如，如果一个用户将5部电影评为

浏览 2提问于2014-10-07得票数 1

回答已采纳

1回答

PYSPARK:如何找到火花放电数据图中两列的余弦相似性？

、、

如何找出火花放电数据中两列之间的余弦相似性？假设我有一个火花数据+--+--||2 |5 |+--+--+cosine_similarity

浏览 4提问于2017-05-09得票数 2

1回答

DataFrames上的Apache Spark Python余弦相似度

、、、、

对于推荐系统，我需要计算整个Spark DataFrame的所有列之间的余弦相似度。在Pandas中，我经常这样做：import pandas as pd metrics.pairwise.cosine_similarity(df.T,df.T) 这会生成列<e

浏览 3提问于2017-05-12得票数 13

2回答

计算两个对象列表之间的相似度

、、、

我想计算两个不同长度的列表之间的相似度。特别是，相似性必须考虑到不同的条件：一般情况下，如果B包含A，则相似性(A，B)->1。但是，相似性度量还应考虑两个列表中元素的数量。(例如，如果A包含1000个对象，而B只包含一个对象，则相似度( A，B)->0)。 -Similarity(A，

浏览 1提问于2018-03-01得票数 0

2回答

可以仅使用非空值在行之间使用余弦相似性吗？

、、

我想要找到一个查询行和另外10个行之间的余弦相似度(或者欧几里得距离，如果更容易)。这些行都是nan值，因此如果列是nan，则忽略它们。因此，我只想得到查询的每个非空列与df列中的行之间的余弦相似性。因此，对于df中的第0行，B和F在查询和df中都是非空的。提前感谢

浏览 0提问于2019-02-11得票数 5

回答已采纳

1回答

看起来，两个特征的余弦相似性仅仅是它们的点乘积，它们的大小的乘积。余弦相似性是什么时候比点积更好的距离度量？也就是说，在不同的情况下，圆点乘积和余弦相似性是否有不同的优缺点？

浏览 0提问于2014-07-15得票数 80

回答已采纳

1回答

如何删除带有副本警告的设置？

、

如何避免在将两个数据序列的余弦相似性值与dataframe spotify_df的列“spotify_df”的余弦相似性值进行关联时设置副本警告，这是否是我应该担心的问题。P.S：user_track_df只有1行，spotify_df大约有6000行，两者的列数相等。

浏览 1提问于2022-05-24得票数 0

回答已采纳

1回答

是否标准化word向量和文档向量之间的相似性？

、、、、

余弦相似度被广泛用于度量两个向量之间的相似性，其中两个向量可以是单词向量或文档向量。。当两个向量之间的余弦相似度为0.78xxx时，

浏览 2提问于2018-05-15得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有效地找到张量与存储在数据列中的所有张量之间的欧氏/余弦距离。

如何比较三个预先训练过的模型的余弦相似性？

熊猫:在约束条件下对每一对列应用函数

用python中的lambda替换嵌套的'for loop‘

余弦相似性与Levenshtein距离

Scala星火中两个稀疏向量的余弦相似性

两个不同DataFrame的列之间的余弦相似性

余弦相似-缺点作为推荐引擎？

PYSPARK:如何找到火花放电数据图中两列的余弦相似性？

DataFrames上的Apache Spark Python余弦相似度

计算两个对象列表之间的相似度

可以仅使用非空值在行之间使用余弦相似性吗？

什么时候用不同的单位加数字才有意义呢？

使用Dataframe的行间火花余弦距离

Python上下文中两个词的余弦相似性

tf-以色列国防军不同长度的文件

余弦相似度与余弦距离的区别

余弦相似度与点积的距离度量

如何删除带有副本警告的设置？

是否标准化word向量和文档向量之间的相似性？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐