腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、
文本
数据集
之间
的
相似
之处。分别使用了
余弦
相似
度
、软
余弦
相似
度
和
移动测度。Gensim返回一个项目列表,包括、docid、
和
相似
性评分。对于
余弦
相似
度
和
软
余弦
相似
度
,我猜
相似
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
1
回答
数值
和
文本
值
的
组合
之间
的
余弦
相似
度
、
、
,其中回答
的
问题是“给定一家餐厅,推荐
相似
的餐厅”。基本上,他们使用一些
文本
字段来构建计数向量器矩阵,然后对行进行
余弦
相似
度
计算,以获得电影
之间
的
相似
度
。我正在尝试使用类别、属性、纬度
和
对数(对于距离)、明星
和
评论计数(基于评论计数对明星进行加权-评论数量越多,对明星
的
权重越大)来构建类似的模型。 但我不知道如何将数字列合并到这里
的
模型中。我是否
浏览 27
提问于2021-02-27
得票数 0
回答已采纳
1
回答
基于
余弦
相似
度
值
的
聚类
、
、
、
我从一组网址中提取了单词,并计算了每个网址
的
contents.And
之间
的
余弦
相似
度
,我还归一化了0-1
之间
的
数值
(使用最小
值
-最大
值
).Now我需要根据
余弦
相似
度
值
来聚类URL找出
相似
的URLs.whichPlease建议我一个动态聚类方法,因为它将是有用
的
,因为它将是有用
的</em
浏览 0
提问于2011-04-30
得票数 2
1
回答
Elasticsearch:在相关评分中使用密集向量上
的
距离(在查询时)
我使用elasticsearch来
组合
不同
的
东西:-基于密集向量(
余弦
相似
度
)
的
文本
得分搜索。我
的
问题是,在查询阶段不计算
余弦
相似
度
,我在
文本
中
的
搜索充当预筛选器。我
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
Pytorch
余弦
相似
度
NxN元素
、
我有128个嵌入向量 image.shape = torch.Size([128, 512]) text.shape = torch.Size([128, 512]) 我想计算包含所有元素
之间
余弦
相似
度
的
张量(即: cosine.shape = torch.Size([128, 128]) 其中第一行是第一图像
和
所有
文本
(128)
之间
的
余弦
相似
度
,等等。目前我只是这样做,但结果是一
浏览 42
提问于2021-04-21
得票数 3
1
回答
两个文档
之间
的
不同特征
、
、
、
我试图找出这两份文件
之间
的
不同之处。我正在使用gensim,到目前为止已经获得了
相似
度
分数。 有没有办法知道两个文档
之间
的
相异分数
和
相异特征?如何评估它?
浏览 1
提问于2018-07-03
得票数 0
3
回答
非常大数据集
的
余弦
相似
性
、
、
、
., 103]步骤2:使用cosine_similarity(df) 求出所有向量
之间
成对
的
余弦
相似
度
(如
浏览 0
提问于2018-12-20
得票数 5
1
回答
当我使用
余弦
相似
度
时,为什么我得到
的
邓恩指数是负值?
、
、
、
我使用了不同
的
相似
度
矩阵,如欧几里得、曼哈顿
和
余弦
,当我使用
余弦
相似
度
时,Dunn指数为负值。我读到过邓恩指数
的
取值范围从0到无穷大。使用
余弦
相似
度
计算Dunn指数是正确
的
吗?
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
1
回答
计算从4个mysql表中检索到
的
所有可能
文本
对
的
余弦
相似
度
、
、
、
、
我有4个表
和
模式(app,text_id,title,text)。现在我想计算所有可能
的
文本
对(标题和
文本
连接在一起)
之间
的
余弦
相似
度
,并最终将它们存储在带有字段(app1,app2,text_id1,text1,text_id2,text2,cosine_similarity)
的
csv文件中。由于有许多可能
的
组合
,因此它应该运行得相当有效。这里最常用
的
方法是什么
浏览 1
提问于2017-01-06
得票数 1
回答已采纳
1
回答
归一化基于tf-idf计算
的
余弦
相似
度
值
、
、
、
我计算基于
余弦
相似
度
的
tf-idf矩阵:sim_desc = cosine_similarity(tfidf_matrix_desc) 但是,sim_desc包含
的
相似
度
大于据我所知,cosine_similarit
浏览 4
提问于2016-06-14
得票数 0
1
回答
潜在语义分析如何处理语义
、
但我不明白它在LSA是如何运作
的
。有人能告诉我LSA是如何处理语义
的
吗。
浏览 5
提问于2014-08-15
得票数 1
回答已采纳
1
回答
数据框中行
的
余弦
相似
度
、
、
、
我有一个数据集,其中每一列都有给定对象
的
不同参数
的
概率。第一列是指示对象名称
的
字符串,而其他所有列都有一个
数值
。 我使用'coop‘包中
的
cosine()函数来查找对象
之间
的
余弦
相似
度
。理想情况下,我希望函数将每一行解释为单独
的
向量,并给出每个对象
之间
的
单独
余弦
相似
度
。无论我做了多少次尝试,我都无法做
浏览 34
提问于2020-04-07
得票数 0
2
回答
可以仅使用非空
值
在行
之间
使用
余弦
相似
性吗?
、
、
我想要找到一个查询行
和
另外10个行
之间
的
余弦
相似
度
(或者欧几里得距离,如果更容易)。这些行都是nan
值
,因此如果列是nan,则忽略它们。因此,我只想得到查询
的
每个非空列与df列中
的
行
之间
的
余弦
相似
性。因此,对于df中
的
第0行,B
和
F在查询
和
df中都是非空
的
。 然后,我想打印每行
的</e
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
1
回答
生成两个具有给定角度
的
向量
、
、
、
我试图用给定
的
余弦
相似
度
生成两个向量。输入将是
余弦
相似
度
的
程度(或者说它取决于它)
和
向量中
的
维数(D),输出将是D维
的
两个向量,与它们
之间
给定
的
相似
度
,现在我知道如何使用
余弦
相似
函数来计算
相似
度
,但当我尝试相反
的
方法时,我迷失了方向。是否有
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
3
回答
最佳简历,文档匹配
、
、
、
、
我用了三种不同
的
方法来计算简历
和
工作描述
之间
的
匹配。有人能告诉我什么方法是最好
的
吗?为什么? Gensim库采用LSA/LSI模型提取关键词,计算文档与查询
之间
的</em
浏览 4
提问于2016-11-02
得票数 1
1
回答
为什么text2vec
的
RWMD模块中
的
距离在1
和
-1
之间
?
、
、
据我所知,伟大
的
text2vec软件包
的
dist2 RWMD特性将矩阵
之间
的
距离计算为
余弦
距离。这不是意味着1-(
余弦
相似
度
)吗?如果
余弦
相似
度
在0到1
之间
运行,那么不是也应该得到0到1
之间
的
值
吗?
浏览 18
提问于2019-10-25
得票数 0
1
回答
欧几里德与
余弦
相似
、
、
、
、
我有一个
文本
数据集,我用tfidf技术矢量化,现在为了进行聚类分析,我正在测量这些向量表示
之间
的
距离。我发现一种常用
的
方法是用
余弦
相似
度
来度量距离,当我问为什么不使用欧氏距离时,通常
的
回答是,当向量
的
大小不同时,
余弦
相似
性更好。由于我
的
文本
矢量化表示是归一化
的
,我想知道使用
余弦
相似
度
比欧几里得
浏览 0
提问于2018-04-11
得票数 2
回答已采纳
2
回答
创建给定
余弦
相似
度
的
随机向量
、
、
给出一些向量v,我想得到另一个随机向量w,v
和
w
之间
有一些
余弦
相似
性,有没有办法在python中得到这个? 示例:为了简单起见,我将使用v3,-4
的
2D向量。我想得到
余弦
相似
度
为60%或+ 0.6
的
随机向量w。这应该生成具有
值
0.875、3
的
向量w或具有相同
余弦
相似
度
的
任何其他向量。所以我希望这是足够清楚
的
。
浏览 48
提问于2018-10-21
得票数 2
回答已采纳
1
回答
余弦
相似
性--一对多
我想知道是否有什么好方法可以使用
余弦
相似
度
来比较单个文档
和
一组文档。显然,你可以计算单个文档
和
集合中每个文档
之间
的
余弦
相似
度
,但如果这样做了,你会取平均值吗?您是否会根据要与原始文档进行比较
的
其他每个文档
的
大小进行加权?我还想知道是否有任何方法可以
组合
正在比较
的
一组文档中
的
所有单词计数,以便最终只计算一次原始文档
和</e
浏览 1
提问于2013-02-27
得票数 0
1
回答
计算python矩阵列
的
余弦
相似
度
、
、
我有一个
数值
矩阵A,如下所示 [1, 2, 2]])但我不想迭代循环中
的
每一列并这样做。所以我先试了一下: fr
浏览 1
提问于2016-06-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文本分析大规模文本处理(1)
数据挖掘干货总结(一)-NLP基础
文本相似度计算综述
一文教你如何正确利用kNN进行机器学习
相似性与相关性度量
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券