腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
计算
Spark
中
两
列
之间
的
余弦
距离
、
、
我在
Spark
dataframe中有包含
两
列
的
Dataframe,每一
列
都包含一个numeric(例如,double或float)类型
的
标量。 我想将这
两
列
解释为向量,并
计算
它们
之间
的
余弦
相似度。到目前为止,我只发现了可以在数据帧单元
中
的
密度向量上使用
的
火花线性代数。代码示例 numpy
中
的
浏览 32
提问于2020-07-14
得票数 0
回答已采纳
1
回答
在MXNet中
计算
余弦
距离
我希望能够使用MXNet
计算
行向量
之间
的
余弦
距离
。此外,我正在处理批次
的
样本,并希望
计算
每对样本
的
余弦
距离
(即批次#1
的
第一行向量与批次#2
的
第一行向量
的
余弦
距离
)。
两
个向量
之间
的
余弦
距离
的
定义与
中
<em
浏览 0
提问于2018-04-03
得票数 0
1
回答
在python中使用scipy.spatial.distance.cosine()之前,你需要标准化你
的
数据吗?
、
、
、
我有
两
个数据集D1和D2。每个数据集具有n个特征(
列
),并且特征值具有不同
的
尺度。我需要找到D1和D2
中
每对相关样本
之间
的
余弦
距离
,以量化D1和D2
的
相似程度。在使用
余弦
距离
之前,需要对D1和D2进行归一化吗?我使用scipy.spatial.distance.cosine(u,v)来
计算
样本u和样本v
之间
的
距离
。 谢谢!
浏览 4
提问于2020-03-26
得票数 1
1
回答
不同库
的
余弦
相似输出不同
、
、
、
我试图找出
两
个n维向量
之间
的
余弦
距离
。我通过使用枕木和滑雪板来做到这一点。不知为何,这
两
个库
的
输出是不同
的
。我不明白为什么。print metrics.pairwise_distances(np.reshape(a,(1,4)),np.reshape(b,(1,4)),metric = 'cosine')[0][0] 此代码
的
输出如下
浏览 2
提问于2016-05-03
得票数 1
回答已采纳
1
回答
火炬Lua,如何
计算
两
个张量
的
每一对单值
的
余弦
距离
?
、
、
、
{aaaTensor, bbbTensor} 我不知道该怎么做。如果我使
浏览 1
提问于2016-08-09
得票数 2
1
回答
使用Dataframe
的
行间火花
余弦
距离
、
、
、
我必须
计算
每一行
之间
的
余弦
距离
,但我不知道如何使用
Spark
,Dataframes优雅地实现它。这样做
的
目的是
计算
每一行(项目)
的
相似性,并通过比较行间
的
相似性来获取前10个相似点。->这是项目-项目推荐系统
的
需要。 我所读到
的
都是关于
列
的
计算
相似性,有人说,是否可以使用PySpark Dataframe
的</em
浏览 4
提问于2017-10-10
得票数 7
回答已采纳
1
回答
如何
计算
两
纬度与经度
的
距离
、
、
、
、
我想
计算
两
个纬度和经度点
之间
的
距离
,我读过关于,Haversine公式,和球
余弦
定律,来
计算
两
点
之间
的
距离
,但我
的
主要动机是得到
两
点
之间
的
最佳位置差。以为例,
的
两
个设备位于彼此
的
位置,而android设备是发送到服务器
的
位置,所以我们需要将每个设备
的
浏览 1
提问于2016-09-19
得票数 4
1
回答
为什么与
spark
MinHashLSHModel approxSimilarityJoin不同
的
文档
的
JaccardDistance总是为0
、
、
我是
Spark
ML
的
新手。
Spark
ML具有用于Jaccard
距离
的
MinHash实现。请参阅文档。在示例代码
中
,用于比较
的
输入数据来自向量。我对示例代码没有任何疑问。但是,当我使用文本文档作为输入,然后通过word2Vec将它们转换为向量时,我得到
的
jaccard
距离
为0。不知道我
的
代码出了什么问题。一些我不明白
的
事情。提前感谢您
的
帮助。(); 从Word2Vec
中<
浏览 4
提问于2019-11-01
得票数 1
1
回答
Matlab k-means cosine将所有内容分配给一个集群
、
、
、
、
我在L2归一化
的
特征矩阵上使用Matlab
的
常规kmeans算法和'Distance','cosine','EmptyAction','drop‘,我有一个问题。Matlab生成
的
输出只是将每个数据点分配给集群1.00000,即使k=20和C
中
的
所有质心都是NaN。对于可能导致这种情况
的
原因,有人有什么建议吗?矩阵
的
布局是(0,1,...,1,0,1,...,0,1,...,1,0,1)。在将文件传递
浏览 0
提问于2012-05-09
得票数 1
回答已采纳
5
回答
余弦
相似性与Levenshtein
距离
、
、
、
我想知道他们
之间
的
区别是什么,在什么情况下他们工作得最好?
余弦
相似是度量内积空间中
两
个非零向量
之间
相似性
的
度量,它度量了它们
之间
夹角
的
余弦
。0°
的
余弦
为1,对于(0,π)半径
的
任意角度都小于1。
列
文希廷
距离
是一个用于测量
两
个序列
之间
差异
的
字符串度量。非正式
浏览 0
提问于2019-11-18
得票数 5
回答已采纳
1
回答
当我使用
余弦
相似度时,为什么我得到
的
邓恩指数是负值?
、
、
、
我使用了不同
的
相似度矩阵,如欧几里得、曼哈顿和
余弦
,当我使用
余弦
相似度时,Dunn指数为负值。我读到过邓恩指数
的
取值范围从0到无穷大。使用
余弦
相似度
计算
Dunn指数是正确
的
吗?
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
2
回答
文档函数
的
相似性
、
、
、
、
我试图为文档
的
余弦
距离
和欧几里德
距离
创建矩阵。不太确定我会怎么处理这个问题。如有任何建议,将不胜感激。谢谢。该函数以termdoc矩阵作为输入,并
计算
变量"euclidean_distance_matrix“和"cosine_distance_matrix",这
两
个矩阵
的
元素(i,j)存储了tweet i-th和input
之间
的
欧氏
距离
和
余弦
距离
。应该
浏览 5
提问于2020-05-21
得票数 1
1
回答
为什么text2vec
的
RWMD模块
中
的
距离
在1和-1
之间
?
、
、
据我所知,伟大
的
text2vec软件包
的
dist2 RWMD特性将矩阵
之间
的
距离
计算
为
余弦
距离
。这不是意味着1-(
余弦
相似度)吗?如果
余弦
相似度在0到1
之间
运行,那么不是也应该得到0到1
之间
的
值吗?我不确定在这种情况下如何解释负
距离
,以及它们与正
距离
有何不同。谢谢!
浏览 18
提问于2019-10-25
得票数 0
1
回答
DataFrames上
的
Apache
Spark
Python
余弦
相似度
、
、
、
、
对于推荐系统,我需要
计算
整个
Spark
DataFrame
的
所有
列
之间
的
余弦
相似度。在Pandas
中
,我经常这样做:import pandas as pd metrics.pairwise.cosine_similarity(df.T,df.T) 这会生成
列
<e
浏览 3
提问于2017-05-12
得票数 13
1
回答
Jaccard
距离
的
选择
、
、
、
为了
计算
两
组单词
之间
的
距离
,我使用jaccard
距离
: JaccardDistance(A, B) = 1 - JaccardIndex(A, B) = 1 - (|A ∩ B| / |A ∪ B|)现在我想知道,还有其他类似的
距离
度量,返回0,1
之间
的
值吗?0表示这
两
个集合包含完全相同
的
元素,而一个完全不同
的
元素。这
两
组可能有不同
的</em
浏览 0
提问于2021-05-01
得票数 0
回答已采纳
1
回答
用
spark
实现TextRank算法(用
spark
计算
余弦
相似度矩阵)
、
、
、
、
我正在尝试实现textrank算法,其中我正在
计算
所有句子
的
余弦
相似矩阵。我想使用
Spark
并行创建相似矩阵
的
任务,但不知道如何实现it.Here代码: cluster_summary_dict = {} cluster_summary_dict[cluster] = pagerank_sentences 这里,cluster_wise_sen是一个字典,它包含不同簇
的
句
浏览 165
提问于2020-07-20
得票数 2
回答已采纳
3
回答
将函数映射到Scipy/numpy矩阵
的
所有
列
、
、
我有一个40*4
的
矩阵M和一个有40个元素
的
向量A。我想
计算
A和M
中
每个
列
向量
之间
的
余弦
距离
。或者有另一种更好
的
方法来做这件事?谢谢!
浏览 0
提问于2012-11-03
得票数 3
回答已采纳
1
回答
为什么用
余弦
距离
来度量词嵌入
之间
的
相似性?
、
、
在
计算
单词
之间
的
相似度时,cosine相似度或
距离
是在字向量上
计算
的
。为什么其他
的
距离
度量,如欧几里德
距离
,不适合这个任务。 让我们考虑
两
个向量a和b。其中,a = [-1,2,-3]和b = [-3,6,-9],这里
的
b = 3*a,也就是,这
两
个向量有相同
的
方向,但大小不同。a和b
的
余弦
相似性为1,表明它们是一致
的<
浏览 0
提问于2020-09-03
得票数 9
回答已采纳
1
回答
理解
两
个TF-IDF向量相似的原因
、
、
我想要一些关于理解TF-IDF向量结果
的
方法
的
反馈,以及可能
的
替代方法。def why_match(doc_vector_a, doc_vector_b, sklearn_tfidfvectoriz
浏览 2
提问于2018-10-27
得票数 0
4
回答
在Apache
Spark
/PySpark中有没有实现带
余弦
距离
的
Kmeans?
、
、
、
在Apache
Spark
中
,有没有将
余弦
距离
的
KMeans应用于Tf-IDF处理
的
数据帧
的
工作实现?
Spark
,当然在ml库中有欧几里得
距离
实现,但对于任何其他
距离
度量都不是这样。
浏览 0
提问于2017-06-26
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
算法:查找图中两个节点之间的距离
高德地图计算两点的坐标距离
计算两个日期之间的天数,你知道哪些函数能够计算呢?
如何在Excel表格中快速的进行两列数据的互换?
机器学习基础:相似度和距离度量究竟是什么
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券