如何在python中找到正确的向量/数组相似度？_如何在python中找到向量和矩阵(大小不同的矩阵)之间的相似距离？_我想知道如何在Python中计算两种numpy数组类型的相似度(数值精度 - 腾讯云开发者社区

python、scikit-learn、scipy、similarity、cosine-similarity

我正在尝试找到一种合适的方法来比较两个数组/向量，不是基于直接的布尔比较，而是基于比例或梯度0,1。最接近的是余弦相似度，但即使是这样，似乎也不是我想要的。但是对于像这样的情况： from scipy import spatial b = np.array([1,2,3,4,5]) print(1 -spatial.distance.cosine(a,b)) 它不应该给

浏览 87提问于2021-09-25得票数 0

2回答

如何在MATLAB中计算两个频率向量之间的余弦相似度？

matlab、vector、cosine-similarity

我需要在MATLAB中找到两个频率向量之间的余弦相似度。a = [2,3,4,4,6,1]如何在MATLAB中度量这些向量之间的余弦相似度？

浏览 40提问于2019-07-25得票数 1

2回答

Python中的术语文档矩阵和余弦相似度

python、numpy、scipy、term-document-matrix

我想使用Python来解决以下情况(最好使用numpy和scipy)：如何在Python中实现这一点？我知道我可以使用scipy.sparse.coo_matrix将文档表示为稀

浏览 3提问于2013-08-07得票数 3

回答已采纳

1回答

在自然语言处理(NLP)中，如何进行有效的降维？

text、machine-learning、nlp、dimensionality-reduction、dimension-reduction

在NLP中，通常情况下，特征的维度非常大。例如，对于手头的一个项目，特征的维度几乎是20,000 (p = 20,000)，并且每个特征都是一个0-1整数，以显示论文中是否存在特定的单词或二元语法(一篇论文是R^{p}$中的数据点$x \)。我知道特征之间的冗余度很大，所以降维是必要的。我有三个问题： 1)我有10,000个数据点(n = 10,000)，每个数据点有10,000个特征(p = 10,000)。进行降维的有效方法是什么

浏览 13提问于2014-11-21得票数 6

1回答

在Python中测量向量化字数的两个数组之间的距离

arrays、dataframe、numpy、cosine-similarity、sentence-similarity

我有一个dataframe，它有一个列，它是标记化(标记化后句子的单词)向量化的结果，而this列由不同维数的数组组成，我想计算dataframe中所有这些数组与输入数组之间的相似度，这也是不同维数的，我如何在python中做到这一点？

浏览 12提问于2021-03-09得票数 0

3回答

python中的相似度匹配计算

python

我正在做一个用python进行问答的项目。我已经有了问答文档的向量和tfidf的值。但是我不知道如何在python中计算相似度匹配。

浏览 2提问于2012-05-20得票数 0

3回答

非常大数据集的余弦相似性

python、numpy、dataframe、cosine-similarity

每个数组都非常适合我的记忆，但我在np.dot()内部调用期间得到了np.dot()我的最终目标是得到与父向量有很高余弦相似性的顶级N个子向量(包括它们的名字，如child_vector_1和相应的余弦分数)。(如上面的数据所示) 步骤3:生成一个元组列表来存储key (如child_vector_1 )和值(如</em

浏览 0提问于2018-12-20得票数 5

1回答

可以在Keras中的CNN之前添加双向LSTM吗？

python、tensorflow、keras、deep-learning、lstm

我目前正在开发一个系统，该系统可以对两个句子是否具有相同的内容进行分类。为此，我使用了预训练的词向量，因此有一个包含句子一的词向量的数组(s1)和一个包含句子二的词向量的数组(s2)。为了对它们是否相似进行分类，我通过将s1中的所有向量与s2中的向量进行成对比较来创建一个矩阵。然后将该矩阵输入到CNN分类器中，

浏览 1提问于2018-10-11得票数 0

1回答

如何在Java或JSP中实现Jaccard索引？

java、mysql、jsp、similarity

我在计算Jaccard相似度时遇到了这个问题，以便使用销售交易的MySQL数据库中的交易id来查找相似的书籍：t2= Java、C#、Python....etcJaccard相似度=(交集/并集)= 2/3 但我不明白如何才能找到这两个向量

浏览 4提问于2013-03-06得票数 2

1回答

一个恰当的向量相似度指标

math、vector、similarity

我正在尝试调整余弦相似度，以确定两个向量相对于条目的相似度。由于所获得的度量在向量尺度{(0，1，2)和(0，2，4)具有余弦相似度1}下是不变的，那么扩展相似性度量以说明初始向量尺度的方法是什么？我想乘以min{|v1|，|v2|}/max{|v1|，|v2|}，其中|v|表示向量v范数，以保持-1和1的界限。任何建

浏览 2提问于2012-01-06得票数 1

回答已采纳

1回答

如何在python中由图节点的边缘列表生成的向量之间找到余弦相似性？

python-3.x、vector、data-mining、cosine-similarity

我想从一个给定的向量嵌入文件中计算出一些图节点的余弦相似度分数。现在如何计算python中每个节点的得分？我相信用科学工具-学习，我们能解决这个问题。我期望输出显示每个节点的余弦相似度评分。 2 -> 0.4 . .我很

浏览 1提问于2019-07-22得票数 0

1回答

基于k-均值聚类和余弦相似度的TF-下手特征向量加权

python、machine-learning、scikit-learn、k-means、tf-idf

我有一组TF-以色列国防军特征向量。我想使用两种方法在数组中找到相似的向量：使用Scikit学习，这个过程非常简单。现在我想对某些特性进行加权，这样它们比其他特性对结果的影响更大。例如，我想对TF-国防军向量的前100个元素进行加权，以便这些特征比其他特征更能表示相似性。我如何在我的特征向量中有意义地加权某些特征？对于我上

浏览 1提问于2015-09-22得票数 1

1回答

如何改进具有语义相似性的向量空间模型？

nlp、word2vec、vector-space-models

我试图构建一个经典的查询系统，通过计算可能答案的归一化文本的TFIDF向量的余弦相似性，为查询找到最可能的候选文本。如果查询和候选文本包含相同(规范化)单词，则此操作非常好。我的系统正确地从语料库中找到了以下最接近的答案：到现在为止还好。我的问题是，如果问题的含义相同，但

浏览 0提问于2017-06-22得票数 -1

1回答

理解不同尺寸张量上的广播和算术运算

python、pytorch、distance

我目前正在计算向量之间的各种相似性度量，比如余弦相似度，欧几里德距离，马氏距离等等。由于我处理的向量可能很大，所以我需要的计算时间最小。我很难理解如何处理不同维度的向量(但是，它们确实共享一个维度)，以及如何在PyTorch中处理这个问题。对于v_a中的A中<

浏览 15提问于2022-05-18得票数 1

回答已采纳

1回答

tf-idf向量空间中的ntc形式到底是什么？

python、nlp、tf-idf

我有一个文本文档的集合。我被要求在tf-idf向量空间和ntc形式中显示每个文档，然后在python中训练一个基于文档向量的svm模型。ntc在这里到底是什么意思？我发现它与tf-idf权重相同，只需一步归一化即所谓的“余弦归一化”。但是我找不到关于这件事的信息。我发现“余弦相似度”与“余弦归一化”不同。它们是一样的吗？我如何在python中创建这个向量呢？

浏览 2提问于2021-01-07得票数 0

1回答

根据菜谱标题推荐配料

machine-learning、python、deep-learning、supervised-learning、semi-supervised-learning

我的想法是，这个问题可以用建议系统来解决，但另一方面，我认为分类/聚类算法可以用于分组/类别中的菜谱划分，一旦输入标题与集群相关联，就可以从集群中生成组分，但我不知道哪一个是最好的解决方案，我不知道是否还有其他的解决方案我正在发布我的临时解决方案将所有数据导入数据库(在我的例子中是postgres)，其中菜谱表只有名称，成分表有名称，ForeignKey有菜谱一旦用户输入菜谱名称(rname)，

浏览 0提问于2018-06-03得票数 0

回答已采纳

1回答

理解gensim word2vec 2的most_similar

python、python-3.x、nlp、gensim、word2vec

我不知道该如何使用gensim's most_similar的Word2Vec方法。假设你想测试一个尝试过的、真实的例子:男人站在国王面前，女人站在X上；找到X。我认为这就是你可以用这个方法做的事情，但从我得到的结果来看，我认为这是不正确的。找出最相似的单词。积极词对相似性有积极的促进作用，消极的词对相似性有积极的促进作用。该方法计算给定词<

浏览 2提问于2019-02-07得票数 2

回答已采纳

1回答

计算python矩阵列的余弦相似度

python、numpy、matrix

我有一个数值矩阵A，如下所示 [1, 2, 2]])但我不想迭代循环中的每一列并这样做。然而，我不确定这是正确的答案。这个函数<e

浏览 1提问于2016-06-21得票数 0

1回答

余弦相似python问题

python、information-retrieval、cosine-similarity、dot-product

嗨，我正在试图计算我的查询和我在python中的信息检索程序返回的文档之间的余弦相似度。对于余弦相似性，我使用以下实现：def cosine_similarity(v1,v2): foridf*国防军权重和每个文档的向量，这是文档向量和查询向量的一个例子： D:

浏览 1提问于2014-09-24得票数 2

2回答

计算给定行向量矩阵的距离矩阵

matrix、numpy、distance

假设我有一个矩阵nxm，它容纳行向量。我想要有一个距离矩阵nxn，它表示每个向量之间的距离。当我使用Numpy时，我如何在Python中做到这一点呢？我知道是Scipy干的，但我想弄脏我的手。我已经写了一个余弦相似度函数cos_dist(a,b)，其中a和b是两个不同的向量。现在，我需要一个调用者函数，它可以有效地为每一对项目执行此操作。我该怎么做呢？

浏览 2提问于2013-05-10得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云