Python -使用scipy加速余弦相似度

、、

下面的问题来自于我之前做过的一个问题：Python - How to speed up cosine similarity with counting arrays 在使用所提出的解决方案时，我面临着一个很大的复杂性问题，基本上，我的实现需要花费大量的时间来构建余弦相似度矩阵。下面是我使用的代码： import numpy as npimport networkx as nx

浏览 57提问于2019-03-23得票数 0

回答已采纳

2回答

Scipy Python中的高效并行稀疏矩阵点积

、、、、

我有一个非常大(1.5M x 16M)的稀疏csr scipy矩阵A。我需要计算的是每对行的相似度。= 0*1 + 1*0 + 0*2 + 4*3 = 12AT = np.transpose(A)现在pairsi，j是行i和行j的相似度，这与行的成对余弦相似度

浏览 2提问于2015-01-28得票数 2

2回答

Python中的术语文档矩阵和余弦相似度

、、、

我想使用Python来解决以下情况(最好使用numpy和scipy)：如何在Python中实现这一点？我知道我可以使用scipy.sparse.coo_matrix将文档表示为稀

浏览 3提问于2013-08-07得票数 3

回答已采纳

2回答

GloVe中两个单词的相似度

、

如何在Glove中找到两个单词的相似度？我们在Word2vec中有model.similarity(word1, word2)。在GloVe中有类似的方式吗？如何保存和加载经过训练的GloVe模型？

浏览 1提问于2019-01-09得票数 0

1回答

理解两个TF-IDF向量相似的原因

、、

目标是找到每个语料库中的哪些文档最相似。当我找到一个有趣的匹配项时，我想知道为什么，所以我实现了一个名为why_match()的简单函数，但我想帮助了解它是否是一种有效的方法。

浏览 2提问于2018-10-27得票数 0

2回答

序列、tf-国防军和余弦相似性

、、、、

我试着用python根据tf-国防军矩阵对一些文档进行聚类。idf = np.log(idf)然后，我使用scipy对这些向量进行聚类：在信息检索的情况下，两个文档

浏览 2提问于2012-12-03得票数 2

回答已采纳

1回答

参数权重在scipy.spatial.distance.cosine中是如何工作的？

、、、

在scipy.spatial.distance.cosine函数中添加了一个新的可选参数权重。称重是如何工作的？是否两个向量都乘以权值，然后取法向余弦相似度？或者它类似于余弦相似，但分子中的每一项都被乘以其相应的权重？

浏览 2提问于2020-02-11得票数 0

回答已采纳

1回答

如何将列表python计算成矩阵相似度

、、

我的数据有问题type(data)是list，实际上是list of listdata[0][0] is unique_id、data[0][1] is category_product和data[0][2] is count 我需要使用基于unique_id的余弦相似度(我计划<e

浏览 2提问于2016-03-31得票数 1

回答已采纳

1回答

快速比较查询与语料库中文档的余弦相似度

、、、

我很好奇公司通常是如何快速计算整个语料库之间的余弦相似度的。例如，如果有人搜索术语“有趣的猫”，并且有100,000个文档至少包含这些术语中的一个，则动态计算查询向量和这100,000个文档向量之间的余弦相似度可能需要很长时间。是否有缓存或加速此搜索的一般策略？

浏览 2提问于2015-07-17得票数 0

2回答

两个矩阵之间的余弦相似度计算

、、

我有一个计算两个矩阵之间余弦相似度的代码： v = vector.reshape(1, -1)我的理想结果是results，这意味着结果包含相似性值的列表

浏览 1提问于2015-05-10得票数 5

2回答

如何在Python中对dict的值进行聚类？

、、、

基本上，我在Python中有一个dict，它使用字符串键和int数组作为值。

浏览 10提问于2017-07-25得票数 1

3回答

具有numpy的大型稀疏矩阵的余弦相似度

、、、、

你能推荐一种更有效的方法来计算大矩阵上的余弦相似度吗，比如下面这个？我想要计算原始矩阵(mat)中65000行中的每一行相对于所有其他行的余弦相似度，这样结果就是一个65000 x 65000矩阵，其中每个元素都是原始矩阵中两行之间的余弦相似度。import numpy as npfrom sklearn.metrics.pairwise import cosine

浏览 3提问于2016-12-01得票数 12

2回答

python手套相似性度量计算

、、

我正在尝试理解python如何计算most-similar术语。我知道，从gensim的word2vec中，most_similar方法用余弦距离来计算相似度。 

浏览 1提问于2016-10-31得票数 4

回答已采纳

1回答

相似性评分在gensim中意味着什么？

、、、

我使用Gensim库来查找句子与段落集合、文本数据集之间的相似之处。分别使用了余弦相似度、软余弦相似度和移动测度。Gensim返回一个项目列表，包括、docid、和相似性评分。对于余弦相似度和软余弦相似度，我猜相似度是向量之间的余弦。我说的对吗？在Gens

浏览 0提问于2021-09-20得票数 0

回答已采纳

1回答

我正在尝试使用scipy稀疏矩阵实现余弦相似度，因为我在使用正常矩阵(非稀疏)时遇到了内存错误。然而，我注意到当输入矩阵(观察值)较大时，稀疏和非稀疏矩阵的余弦相似度的内存大小(以字节为单位)几乎相同。我是不是做错了什么，或者，有没有办法解决这个问题？这里的代码中，输入有5%为1，95%为0。import numpy as np from sklearn.metrics.pairwise import cosine_similarit

浏览 0提问于2018-12-10得票数 1

2回答

创建给定余弦相似度的随机向量

、、

给出一些向量v，我想得到另一个随机向量w，v和w之间有一些余弦相似性，有没有办法在python中得到这个？示例:为了简单起见，我将使用v3，-4的2D向量。我想得到余弦相似度为60%或+ 0.6的随机向量w。这应该生成具有值0.875、3的向量w或具有相同余弦相似度的任何其他向量。所以我希望这是足够清楚的。

浏览 48提问于2018-10-21得票数 2

回答已采纳

2回答

Python中的矢量化余弦相似度计算

、、

对于A中的每个向量，我尝试计算与B中所有向量的余弦相似度，以便找到B中最匹配给定A向量的前5个向量。现在，我循环遍历所有的A，循环遍历所有的B，使用SciPy的spatial.distance.cosine(a, b)逐一计算余弦相似性。有没有更快的方法来做这件事？也许是用矩阵？

浏览 0提问于2015-12-03得票数 6

2回答

使用Pandas Dataframe时，Scipy* Cosine相似性非常慢*

、、、、

几天前，我开始通过做一个项目来学习Python。我从我的数据中准备了两个数据帧，分别是User和Item Dataframe。用户DF有17k个不同的用户，项目DF有1500张专辑。我正在使用协同过滤来获取两个数据帧之间的余弦相似度，如下所示for i in range(0,len(user_normalized.index我测试了几个用户(<10)的逻辑，观察到余弦计算的执行时

浏览 2提问于2018-05-23得票数 0

1回答

用什么正确的方法来总结由Gensim生成的word2vec向量？

、、

=model.wv.get_vector('B')v4=model.wv.get_vector('D') 我想比较一下v1+v2和v3+v4的余弦相似性我应该使用什么numpy函数？

浏览 1提问于2022-02-23得票数 0

1回答

从coo_matrix到csr_matrix计算无矩阵重复和的余弦相似度

、、、

我想要计算购买数据集的产品之间的余弦相似度。我有超过100000行( row =用户购买事件)和超过80000个产品。要避免使用pandas.crosstab使数据集采用以下格式，请执行以下操作：> 我将购买数据集转换为scipy.coo_matrix，并认为我必须执行tocsr()来执行产品之间的归一化和<em

浏览 21提问于2018-09-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Scipy Python中的高效并行稀疏矩阵点积

Python中的术语文档矩阵和余弦相似度

GloVe中两个单词的相似度

理解两个TF-IDF向量相似的原因

序列、tf-国防军和余弦相似性

参数权重在scipy.spatial.distance.cosine中是如何工作的？

如何将列表python计算成矩阵相似度

快速比较查询与语料库中文档的余弦相似度

两个矩阵之间的余弦相似度计算

如何在Python中对dict的值进行聚类？

具有numpy的大型稀疏矩阵的余弦相似度

python手套相似性度量计算

相似性评分在gensim中意味着什么？

Scipy稀疏矩阵在余弦相似性方面不能有效地存储

创建给定余弦相似度的随机向量

Python中的矢量化余弦相似度计算

使用Pandas Dataframe时，Scipy* Cosine相似性非常慢*

用什么正确的方法来总结由Gensim生成的word2vec向量？

从coo_matrix到csr_matrix计算无矩阵重复和的余弦相似度

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐