腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、文本数据集之间的
相似
之处。分别使用了
余弦
相似
度
、软
余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于
余弦
相似
度
和软
余弦
相似
度
,我猜
相似
度
是向量之间的
余弦
。我说的对吗? 在Gensim文档中,他们写道,这是语义的关联
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
1
回答
生成两个具有给定角度的向量
、
、
、
我试图用给定的
余弦
相似
度
生成两个向量。输入将是
余弦
相似
度
的程度(或者说它取决于它)和向量中的维数(D),输出将是D维的两个向量,与它们之间给定的
相似
度
,现在我知道如何使用
余弦
相似
函数来计算
相似
度
,但当我尝试相反的方法时,我迷失了方向。
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
1
回答
如何在MALLET中获取两个文档之间的
余弦
相似
度
?
、
、
、
我有一个使用MALLET训练的LDA主题模型,但是我想计算两个文档之间的
余弦
相似
度
来获得
相似
度
,但是我不确定我要计算哪个文件的
余弦
。我的
余弦
相似
度
函数运行得很好,但我不确定我在MALLET中比较的是什么。 任何帮助都将不胜感激!
浏览 1
提问于2017-04-07
得票数 0
1
回答
当我使用
余弦
相似
度
时,为什么我得到的邓恩指数是负值?
、
、
、
我使用了不同的
相似
度
矩阵,如欧几里得、曼哈顿和
余弦
,当我使用
余弦
相似
度
时,Dunn指数为负值。我读到过邓恩指数的取值范围从0到无穷大。使用
余弦
相似
度
计算Dunn指数是正确的吗?
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
1
回答
我们如何计算由评级表示的两个项目的调整后的
余弦
相似
度
?
、
、
、
我想分别为a和b表示的两个项目计算调整后的
余弦
相似
值。我们取两个向量a={2,3,1,0}和b={1,0,4,2}。我知道
余弦
相似
度
是如何工作的,但我坚持使用调整后的
余弦
相似
度
方法。
浏览 4
提问于2016-02-18
得票数 0
1
回答
Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)
我使用elasticsearch来组合不同的东西:-基于密集向量(
余弦
相似
度
)的文本得分搜索。我的问题是,在查询阶段不计算
余弦
相似
度
,我在文本中的搜索充当预筛选器。我将始终获得结果链接到文本搜索,即使
余弦
相似
更好。我想在查询时计算
余弦
相似
度</em
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
文档
相似
性-多个文档以相同的
相似
性评分结束
我一直在处理一个业务问题,需要找到与现有文档
相似
的新文档。我使用了如下各种方法2.TFIDF +
余弦
相似
他们都没有像预期的那样工作。最后,我发现了一种更好的方法-- Word2vec +软
余弦
相似
性。 但新的挑战是,我最终得到了具有相同
相似
性评分的多个文档。它们大多是相关的,但很少有,即使有一些语义
相似
浏览 1
提问于2020-04-16
得票数 0
1
回答
归一化基于tf-idf计算的
余弦
相似
度
值
、
、
、
我计算基于
余弦
相似
度
的tf-idf矩阵:sim_desc = cosine_similarity(tfidf_matrix_desc) 但是,sim_desc包含的
相似
度
大于在这种情况下,我需要对
余弦
相似
性得分进行归
浏览 4
提问于2016-06-14
得票数 0
3
回答
最佳简历,文档匹配
、
、
、
、
我使用NLTK进行关键字提取,然后用RAKE进行关键字/关键字打分,然后使用
余弦
相似
度
。 用于关键词提取、tf和
余弦
相似
度
计算的Scikit。Gensim库采用LSA/LSI模型提取关键词,计算文档与查询之间的
余弦
相似
度
。
浏览 4
提问于2016-11-02
得票数 1
1
回答
文档
相似
度
的不同方法(LDA、LSA、
余弦
)
、
、
、
、
我使用了三种不同的文档
相似
度
方法:- tfidf矩阵上的简单
余弦
相似
度
-在整个语料库上应用LDA,然后使用LDA模型为每个文档创建向量,然后应用
余弦
相似
度
。对整个语料库进行-applying LSA,然后使用LSA模型为每个文档创建向量,然后应用
余弦
相似
度
。基于实验,我在没有任何LDA或LSA的情况下,在tfidf矩阵上的简单
余弦
相似
度上得到了更好的结果。根据我所
浏览 20
提问于2017-01-06
得票数 0
1
回答
在没有方向的情况下,如何利用文档特征向量上的
余弦
相似
度
公式?
、
在数据科学中,为了识别文档的
相似
性,我们将文档转换为特征向量。然后应用源文档与目标文档特征向量之间的
余弦
角公式。 然而,
余弦
公式仅适用于向量。一个矢量应该有两个震级和方向。
浏览 0
提问于2020-05-17
得票数 1
1
回答
关于word2vec most_similar()函数
、
、
我使用如下的most_similar()方法来获取与给定单词
相似
的所有单词:AFAIK,它的作用是计算给定单词和字典中所有其他单词之间的
余弦
相似
度
。另外,如果它使用
余弦
相似
度
,它是如何得到负值的?对于两个文档,
余弦
相似
度
在0-1之间变化。
浏览 2
提问于2016-01-19
得票数 5
1
回答
聚类算法
、
、
我有稀疏向量,并且发现
余弦
相似
度
是度量
相似
度
的有效方法。现在我想根据
相似
性对这些向量进行聚类。因此,有人能建议/推荐使用
余弦
相似
性的聚类算法吗? P.S.
浏览 0
提问于2017-07-03
得票数 0
回答已采纳
1
回答
Spark MLLib的Word2Vec
余弦
相似
度
大于1
、
、
在word2vec的spark实现上,由于某些原因,当迭代或数据分区的数量大于1时,
余弦
相似
度
大于1。 据我所知,
余弦
相似
度
应该总是-1 < cos < 1。有人知道为什么吗?
浏览 1
提问于2015-10-27
得票数 5
1
回答
项目间的
余弦
相似
性(购买数据)与标准化
、
、
、
我使用表示产品用户购买行为的IndexedRowMatrix,为了构建产品推荐,我使用
余弦
相似
度
来计算产品之间的
相似
性。PySpark提供了一个名为columnSimilarities()的函数。我读过关于归一化和
余弦
相似
的文章,并且理解
余弦
相似
已经对向量进行了归一化,就好像我们把向量规范化了一样,
余弦
相似
性就是这两个向量的点乘积。参考文献 另外,
余弦
相似
度
与点积
浏览 0
提问于2018-11-19
得票数 3
2
回答
Scipy Python中的高效并行稀疏矩阵点积
、
、
、
、
我需要计算的是每对行的
相似
度
。= 0*1 + 1*0 + 0*2 + 4*3 = 12AT = np.transpose(A)现在pairsi,j是行i和行j的
相似
度
,这与行的成对
余弦
相似
度
非常
相似
。因此,如果有一个高效的并行算法来计算成对
余弦
<em
浏览 2
提问于2015-01-28
得票数 2
2
回答
如何在MATLAB中计算两个频率向量之间的
余弦
相似
度
?
、
、
我需要在MATLAB中找到两个频率向量之间的
余弦
相似
度
。a = [2,3,4,4,6,1]如何在MATLAB中度量这些向量之间的
余弦
相似
度
?
浏览 40
提问于2019-07-25
得票数 1
2
回答
使用相同源的
余弦
相似
和完全不同的结果
、
、
、
、
我正在学习单词嵌入和
余弦
相似
性。我的数据是由两组相同的词组成的,但用的是两种不同的语言。 我是否应该期望获得同样的结果?我注意到有时我有两个相反的结果。因为我是新来的,所以我想弄清楚我是否做错了什么,或者背后是否有解释。根据我所读到的,软
余弦
相似
<
浏览 3
提问于2019-07-24
得票数 0
回答已采纳
1
回答
是否标准化word向量和文档向量之间的
相似
性?
、
、
、
、
余弦
相似
度
被广泛用于度量两个向量之间的
相似
性,其中两个向量可以是单词向量或文档向量。。当两个向量之间的
余弦
相似
度
为0.78xxx时,包括我在内的人可能会期望“这两个向量有78 %的
相似
性!”,这并不是两个
浏览 2
提问于2018-05-15
得票数 0
1
回答
仅对于匹配的文档,与Lucene的
余弦
相似
性
、
、
、
现在,我试图计算文档之间的
余弦
相似
度
。输入查询将是一个文档,输出应该是
余弦
分数。它是介于0到1之间的一个数字。 遍历所有文档ids,0到ma
浏览 5
提问于2015-09-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
余弦相似度算法进行客户流失分类预测
循环神经网络(三)——词嵌入学习与余弦相似度
论文查重相似度28%能通达吗 发表论文的相似度是多少?
文本相似度计算综述
移动端图像相似度算法选型
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券