相似度计算函数_余弦相似度:函数不能计算矩阵_句子相似度计算 - 腾讯云开发者社区

java、modeling、lda、mallet

我有一个使用MALLET训练的LDA主题模型，但是我想计算两个文档之间的余弦相似度来获得相似度，但是我不确定我要计算哪个文件的余弦。我的余弦相似度函数运行得很好，但我不确定我在MALLET中比较的是什么。任何帮助都将不胜感激！

浏览 1提问于2017-04-07得票数 0

1回答

Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)

elasticsearch

我使用elasticsearch来组合不同的东西：-基于密集向量(余弦相似度)的文本得分搜索。我的问题是，在查询阶段不计算余弦相似度，我在文本中的搜索充当预筛选器。我将始终获得结果链接到文本搜索，即使余弦相似更好。例如，如果一个score函数在计算上很昂贵，并且它足以计算经

浏览 1提问于2020-01-29得票数 1

回答已采纳

1回答

生成两个具有给定角度的向量

math、vector、linear-algebra、cosine-similarity

我试图用给定的余弦相似度生成两个向量。输入将是余弦相似度的程度(或者说它取决于它)和向量中的维数(D)，输出将是D维的两个向量，与它们之间给定的相似度，现在我知道如何使用余弦相似函数来计算相似度，但当我尝试相反的方法时，我迷失了方向。

浏览 6提问于2022-05-25得票数 1

回答已采纳

1回答

字符串包中Jaccard相似度匹配字符串中的单词

r、text、stringdist

我想使用字符串函数中的Jaccard相似度来确定词袋的相似度。据我所知，使用Jaccard只能通过字符串中的字母进行匹配。'person')[1] 0 0 1 所以我们在这里看到它计算“猫”和“猫”，“狗”和“狗”以及“人”和“ufo”的

浏览 1提问于2016-05-11得票数 3

2回答

如何计算一个项目和一个项目集之间的距离或相似度？

r、distance、similarity

我所知道的所有包中的dist/相似度函数都是用来计算矩阵中“每一对行”的距离/相似度的。如果输入矩阵非常大，dist矩阵将需要更大的内存，因为n行输入矩阵将导致n*n大小的dist矩阵。我有一个目标项目x和一个项目集Y，我想计算这个目标项目x和Y中每个项目y之间的距离/相似度。我如何在R中做到这一点？

浏览 1提问于2013-05-27得票数 1

回答已采纳

1回答

Jaccard相似度计算相似度

similarity、jaccard-coefficient

我不清楚如何从这个例子中计算出两个产品之间的相似性。📷

浏览 0提问于2019-05-24得票数 1

回答已采纳

1回答

在mahout谱聚类中，亲和力矩阵中的对角元素值应该是多少

java、hadoop、mapreduce、data-mining、mahout

正如标题所述，下面是指向频谱聚类的链接提前谢谢..

浏览 0提问于2014-09-06得票数 0

2回答

计算句子集合之间的语义相似度

nlp、word2vec、tf-idf、cosine-similarity、sentence-similarity

我有两组短消息，我想计算这两组短消息之间的相似度，并根据它们的语义相似度来识别它们是否在谈论相同的子主题。我知道如何使用成对相似度，我的问题是我想计算两个集合中所有句子之间的总体相似度，而不是两个句子的相似度。有没有办法使用tf-idf或带有余弦相似度的word2vec/doc2vec来计算总分？

浏览 4提问于2019-08-02得票数 0

1回答

如何用Lucene和Java计算tf-国防军的余弦相似度

java、lucene、tf-idf、cosine-similarity

我需要根据与tf-国防军的余弦相似性对这些文件进行排序。请有人告诉我，我能从Lucene那里得到什么支持来计算这个？从Lucene可以直接计算出哪些参数(可以通过lucene中的某些方法直接得到tf、国防军吗？)如何用Lucene计算余弦相似度(如果传递查询和文档的两个向量，是否有直接返回余弦相似度的函数?)

浏览 1提问于2012-04-16得票数 2

1回答

如何使用TF-以色列国防军或带有gensim的LSA计算单词相似度？

python、nlp、tf-idf、gensim、lsa

我知道gensim中的word2vec可以计算单词之间的相似度。但是现在我想用TF或者用gensim来计算词的相似度.该怎么做呢？注:使用LSA和gensim计算文档相似度很容易：

浏览 6提问于2016-03-14得票数 3

1回答

将用户定义的函数应用于pandas中的groupby

python、python-3.x、pandas

我现在定义了一个函数ACS，我想用它来计算每个用户的平均内容相似度。，并返回它们之间的相似度，范围从0到1。我的目的是计算每个用户的内容相似度，因此我形成了一个groupby，如下所示： grouped = df.groupby('user_id')['review'] 现在，我想对每个组(类似于grouped.ACS但问题是ACS将两个字符串作为输入并计算它们的相似<

浏览 16提问于2020-06-12得票数 0

1回答

使用Gensim更新TF-IDF

python、gensim、similarity、tf-idf

您好，我正在使用Gensim来查找文档之间的相似度，因此我对文档进行TF-IDF并计算余弦相似度。当我有新文档时，我可以使用index[tfidfvec]计算这个文档与以前文档的相似度，但是这样TF-IDF不会更新，并且在相似度计算中不考虑新词。有没有什么解决方案可以快速更新TF-IDF而无需重新计算整个矩阵，或者对我的问题有什么最好的解决方案？

浏览 2提问于2018-12-26得票数 2

1回答

基于Okapi模式的文档相似度计算

java、lucene、similarity

我从这里的和本文的中发现Okapi相似性度量可以用于计算文档相似度例如，我有10个文档(文档#A、#B、#C、#D等)在我的文档集合中然后使用这两种方法计算查询文档与其他文档之间的相似度。1)查询单据与单据#B= idfOfQueryDoc* tfOfDocument #B的相似<em

浏览 2提问于2012-06-13得票数 1

回答已采纳

2回答

Scipy Python中的高效并行稀疏矩阵点积

performance、numpy、scipy、sparse-matrix、dot-product

我需要计算的是每对行的相似度。= 0*1 + 1*0 + 0*2 + 4*3 = 12AT = np.transpose(A)现在pairsi，j是行i和行j的相似度，这与行的成对余弦相似度非常相似。因此，如果有一个高效的并行算法来计算成对余弦<em

浏览 2提问于2015-01-28得票数 2

1回答

RapidMiner:计算文档相似度

rapidminer

我正在使用Rapidminer计算文档之间的相似性。我正在使用来自我的Java应用程序的这个过程。此过程计算每个文档与数据集中的每个其他文档的相似性。我不想计算每个文档之间的相似性。I只想计算一个选定文档与所有其他文档的相似度。数据到相似度计算这些向量之间的余弦相似性。因此，基本上，我需要

浏览 3提问于2016-05-18得票数 0

回答已采纳

0回答

使用Armadillo C++的余弦相似度给出了否定的结果

c++、linear-algebra、armadillo

我已经实现了一个余弦相似函数，它使用c++线性函数库。0.7056-0.9650 0.2072 -0.1551 0.0426当我计算第二行和所有行之间的余弦相似度时，我得到了以下结果：相似度1,1: 1 相似度1,

浏览 1提问于2016-07-11得票数 2

回答已采纳

1回答

如何计算pandas数据框中组的每对行之间的函数

python、pandas、pandas-groupby

我想为一条记录计算一个函数，每组中的其他记录，然后取每条记录的最大值。例如：a, 1, str1a, 1, str3a, 2, str5假设我的函数是计算字符串中的相似度，然后我想计算str1，str2和str1，str3之间的相似度，并将最大值作为第一行的新列。str2，str1和str2，str3之间的相似<

浏览 17提问于2020-03-17得票数 0

1回答

计算相似度

sql、database、oracle、function、similarity

我有这个代码来计算两个食谱之间的相似度--一般方程=相似度(r1，r2)例如，给定一个食谱有4种配料(鸡肉，哈吉斯，奶油，威士忌)。因此相似度将为(2*2/4+5) = 0.4。

浏览 2提问于2015-04-22得票数 1

1回答

运行时成千上万个大型数据集的Jaccard相似算法

java、algorithm、hash、bitset、cardinality

我所需要的我认为有两种可能的解决办法：使用MinHash算法。这个解决方案的问题是它非常慢。问题1解决方案2 使用HyperLogLog或BitSet

浏览 6提问于2017-04-03得票数 2

2回答

修正的余弦相似效率

python、arrays、numpy、scikit-learn、scipy

问题所在我试图计算两个数组之间的余弦相似度，但基本公式略有变化。也就是说，我只关心与“引用”数组重叠的组件。例如，B中的第一行是[1 1 0]，所以相似度计算使用修改后的A矩阵： [1 0 0][0 1 1] 我的问题是我知道没有什么比标准的余弦相似度计算更快的了，但现在我尝试引入这个改变

浏览 28提问于2019-10-15得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在MALLET中获取两个文档之间的余弦相似度？

Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)

生成两个具有给定角度的向量

字符串包中Jaccard相似度匹配字符串中的单词

如何计算一个项目和一个项目集之间的距离或相似度？

Jaccard相似度计算相似度

在mahout谱聚类中，亲和力矩阵中的对角元素值应该是多少

计算句子集合之间的语义相似度

如何用Lucene和Java计算tf-国防军的余弦相似度

如何使用TF-以色列国防军或带有gensim的LSA计算单词相似度？

将用户定义的函数应用于pandas中的groupby

使用Gensim更新TF-IDF

基于Okapi模式的文档相似度计算

Scipy Python中的高效并行稀疏矩阵点积

RapidMiner:计算文档相似度

使用Armadillo C++的余弦相似度给出了否定的结果

如何计算pandas数据框中组的每对行之间的函数

计算相似度

运行时成千上万个大型数据集的Jaccard相似算法

修正的余弦相似效率

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐