腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在MALLET中获取两个文档之间的余弦
相似
度
?
java
、
modeling
、
lda
、
mallet
我有一个使用MALLET训练的LDA主题模型,但是我想
计算
两个文档之间的余弦
相似
度
来获得
相似
度
,但是我不确定我要
计算
哪个文件的余弦。我的余弦
相似
度
函数
运行得很好,但我不确定我在MALLET中比较的是什么。 任何帮助都将不胜感激!
浏览 1
提问于2017-04-07
得票数 0
1
回答
Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)
elasticsearch
我使用elasticsearch来组合不同的东西:-基于密集向量(余弦
相似
度
)的文本得分搜索。我的问题是,在查询阶段不
计算
余弦
相似
度
,我在文本中的搜索充当预筛选器。我将始终获得结果链接到文本搜索,即使余弦
相似
更好。例如,如果一个score
函数
在
计算
上很昂贵,并且它足以
计算
经
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
生成两个具有给定角度的向量
math
、
vector
、
linear-algebra
、
cosine-similarity
我试图用给定的余弦
相似
度
生成两个向量。输入将是余弦
相似
度
的程度(或者说它取决于它)和向量中的维数(D),输出将是D维的两个向量,与它们之间给定的
相似
度
,现在我知道如何使用余弦
相似
函数
来
计算
相似
度
,但当我尝试相反的方法时,我迷失了方向。
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
1
回答
字符串包中Jaccard
相似
度
匹配字符串中的单词
r
、
text
、
stringdist
我想使用字符串
函数
中的Jaccard
相似
度
来确定词袋的
相似
度
。据我所知,使用Jaccard只能通过字符串中的字母进行匹配。'person')[1] 0 0 1 所以我们在这里看到它
计算
“猫”和“猫”,“狗”和“狗”以及“人”和“ufo”的
浏览 1
提问于2016-05-11
得票数 3
2
回答
如何
计算
一个项目和一个项目集之间的距离或
相似
度
?
r
、
distance
、
similarity
我所知道的所有包中的dist/
相似
度
函数
都是用来
计算
矩阵中“每一对行”的距离/
相似
度
的。 如果输入矩阵非常大,dist矩阵将需要更大的内存,因为n行输入矩阵将导致n*n大小的dist矩阵。我有一个目标项目x和一个项目集Y,我想
计算
这个目标项目x和Y中每个项目y之间的距离/
相似
度
。我如何在R中做到这一点?
浏览 1
提问于2013-05-27
得票数 1
回答已采纳
1
回答
Jaccard
相似
度
计算
相似
度
similarity
、
jaccard-coefficient
我不清楚如何从这个例子中
计算
出两个产品之间的
相似
性。📷
浏览 0
提问于2019-05-24
得票数 1
回答已采纳
1
回答
在mahout谱聚类中,亲和力矩阵中的对角元素值应该是多少
java
、
hadoop
、
mapreduce
、
data-mining
、
mahout
正如标题所述,下面是指向频谱聚类的链接提前谢谢..
浏览 0
提问于2014-09-06
得票数 0
2
回答
计算
句子集合之间的语义
相似
度
nlp
、
word2vec
、
tf-idf
、
cosine-similarity
、
sentence-similarity
我有两组短消息,我想
计算
这两组短消息之间的
相似
度
,并根据它们的语义
相似
度
来识别它们是否在谈论相同的子主题。我知道如何使用成对
相似
度
,我的问题是我想
计算
两个集合中所有句子之间的总体
相似
度
,而不是两个句子的
相似
度
。有没有办法使用tf-idf或带有余弦
相似
度
的word2vec/doc2vec来
计算
总分?
浏览 4
提问于2019-08-02
得票数 0
1
回答
如何用Lucene和Java
计算
tf-国防军的余弦
相似
度
java
、
lucene
、
tf-idf
、
cosine-similarity
我需要根据与tf-国防军的余弦
相似
性对这些文件进行排序。请有人告诉我,我能从Lucene那里得到什么支持来
计算
这个?从Lucene可以直接
计算
出哪些参数(可以通过lucene中的某些方法直接得到tf、国防军吗?)如何用Lucene
计算
余弦
相似
度
(如果传递查询和文档的两个向量,是否有直接返回余弦
相似
度
的
函数
?)
浏览 1
提问于2012-04-16
得票数 2
1
回答
如何使用TF-以色列国防军或带有gensim的LSA
计算
单词
相似
度
?
python
、
nlp
、
tf-idf
、
gensim
、
lsa
我知道gensim中的word2vec可以
计算
单词之间的
相似
度
。但是现在我想用TF或者用gensim来
计算
词的
相似
度
.该怎么做呢? 注:使用LSA和gensim
计算
文档
相似
度
很容易:
浏览 6
提问于2016-03-14
得票数 3
1
回答
将用户定义的
函数
应用于pandas中的groupby
python
、
python-3.x
、
pandas
我现在定义了一个
函数
ACS,我想用它来
计算
每个用户的平均内容
相似
度
。,并返回它们之间的
相似
度
,范围从0到1。我的目的是
计算
每个用户的内容
相似
度
,因此我形成了一个groupby,如下所示: grouped = df.groupby('user_id')['review'] 现在,我想对每个组(类似于grouped.ACS但问题是ACS将两个字符串作为输入并
计算
它们的
相似<
浏览 16
提问于2020-06-12
得票数 0
1
回答
使用Gensim更新TF-IDF
python
、
gensim
、
similarity
、
tf-idf
您好,我正在使用Gensim来查找文档之间的
相似
度
,因此我对文档进行TF-IDF并
计算
余弦
相似
度
。当我有新文档时,我可以使用index[tfidfvec]
计算
这个文档与以前文档的
相似
度
,但是这样TF-IDF不会更新,并且在
相似
度
计算
中不考虑新词。有没有什么解决方案可以快速更新TF-IDF而无需重新
计算
整个矩阵,或者对我的问题有什么最好的解决方案?
浏览 2
提问于2018-12-26
得票数 2
1
回答
基于Okapi模式的文档
相似
度
计算
java
、
lucene
、
similarity
我从这里的和本文的中发现Okapi
相似
性度量可以用于
计算
文档
相似
度
例如,我有10个文档(文档#A、#B、#C、#D等)在我的文档集合中然后使用这两种方法
计算
查询文档与其他文档之间的
相似
度
。1)查询单据与单据#B= idfOfQueryDoc* tfOfDocument #B的
相似
<em
浏览 2
提问于2012-06-13
得票数 1
回答已采纳
2
回答
Scipy Python中的高效并行稀疏矩阵点积
performance
、
numpy
、
scipy
、
sparse-matrix
、
dot-product
我需要
计算
的是每对行的
相似
度
。= 0*1 + 1*0 + 0*2 + 4*3 = 12AT = np.transpose(A)现在pairsi,j是行i和行j的
相似
度
,这与行的成对余弦
相似
度
非常
相似
。因此,如果有一个高效的并行算法来
计算
成对余弦<em
浏览 2
提问于2015-01-28
得票数 2
1
回答
RapidMiner:
计算
文档
相似
度
rapidminer
我正在使用Rapidminer
计算
文档之间的
相似
性。我正在使用来自我的Java应用程序的这个过程。此过程
计算
每个文档与数据集中的每个其他文档的
相似
性。我不想
计算
每个文档之间的
相似
性。I只想
计算
一个选定文档与所有其他文档的
相似
度
。数据到
相似
度
计算
这些向量之间的余弦
相似
性。因此,基本上,我需要
浏览 3
提问于2016-05-18
得票数 0
回答已采纳
0
回答
使用Armadillo C++的余弦
相似
度
给出了否定的结果
c++
、
linear-algebra
、
armadillo
我已经实现了一个余弦
相似
函数
,它使用c++线性
函数
库。0.7056-0.9650 0.2072 -0.1551 0.0426当我
计算
第二行和所有行之间的余弦
相似
度
时,我得到了以下结果:
相似
度
1,1: 1
相似
度
1,
浏览 1
提问于2016-07-11
得票数 2
回答已采纳
1
回答
如何
计算
pandas数据框中组的每对行之间的
函数
python
、
pandas
、
pandas-groupby
我想为一条记录
计算
一个
函数
,每组中的其他记录,然后取每条记录的最大值。例如:a, 1, str1a, 1, str3a, 2, str5假设我的
函数
是
计算
字符串中的
相似
度
,然后我想
计算
str1,str2和str1,str3之间的
相似
度
,并将最大值作为第一行的新列。str2,str1和str2,str3之间的
相似<
浏览 17
提问于2020-03-17
得票数 0
1
回答
计算
相似
度
sql
、
database
、
oracle
、
function
、
similarity
我有这个代码来
计算
两个食谱之间的
相似
度
--一般方程=
相似
度
(r1,r2)例如,给定一个食谱有4种配料(鸡肉,哈吉斯,奶油,威士忌)。因此
相似
度
将为(2*2/4+5) = 0.4。
浏览 2
提问于2015-04-22
得票数 1
1
回答
运行时成千上万个大型数据集的Jaccard
相似
算法
java
、
algorithm
、
hash
、
bitset
、
cardinality
我所需要的我认为有两种可能的解决办法:使用MinHash算法。这个解决方案的问题是它非常慢。问题1解决方案2 使用HyperLogLog或BitSet
浏览 6
提问于2017-04-03
得票数 2
2
回答
修正的余弦
相似
效率
python
、
arrays
、
numpy
、
scikit-learn
、
scipy
问题所在 我试图
计算
两个数组之间的余弦
相似
度
,但基本公式略有变化。也就是说,我只关心与“引用”数组重叠的组件。例如,B中的第一行是[1 1 0],所以
相似
度
计算
使用修改后的A矩阵: [1 0 0][0 1 1] 我的问题是我知道没有什么比标准的余弦
相似
度
计算
更快的了,但现在我尝试引入这个改变
浏览 28
提问于2019-10-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本相似度计算综述
计算图像相似度——《Python也可以》
深度学习解决NLP问题:语义相似度计算
用线性规划去计算句子之间的相似度
四种计算文本相似度的方法对比
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券