腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
有效地找到张量与存储在数据
列
中
的
所有张量
之间
的
欧氏/
余弦
距离。
、
、
、
、
我有一个张量'input_sentence_embed‘,形状为torch.Size(1768) INCIDENT_NUMBER‘和'matched_df’
的
每一行
之间
的
欧几里德/
余弦
相似性
。如果它们是标量值,我可以很容易地将'input_sentence_embed‘作为'matched_df’中
的
一个新
列
广播,然后找到两
浏览 0
提问于2021-05-23
得票数 0
回答已采纳
1
回答
如何比较三个预先训练过
的
模型
的
余弦
相似性
?
、
、
、
、
我有
两个
语料库--一个是所有女性领袖
的
演讲,另一个是男性领袖演讲。我想检验一个语料库中
两个
词
之间
的
余弦
相似性
与另一个语料库中相同
的
两个
词
之间
的
余弦
相似性
是显著
不同
的
假设。这样
的
t检验(或等效
的
)逻辑和可能吗? 此外,如果
两个
语料库
之间
的
<e
浏览 3
提问于2020-05-11
得票数 0
回答已采纳
1
回答
熊猫:在约束条件下对每一对
列
应用函数
、
、
正如标题所述,在某些条件下,我试图对
dataframe
的
每一对
列
应用一个函数。我要试着说明这一点。我
的
df
的
形式如下:w1 | 0 | 5 | 3 | ... w2 | 2 | 5 | 4该代码对应于矩形网格中确定
的
位置,而ws是
不同
的
单词。我想在每一对
列
之间
应用
余弦
相似性
度
浏览 0
提问于2016-07-19
得票数 3
回答已采纳
1
回答
用python中
的
lambda替换嵌套
的
'for loop‘
、
、
我正在处理一项任务,需要检查
两个
dataframe
列
之间
的
余弦
相似性
。我使用
两个
for循环分别迭代data1和data2
的
两
列
。在检查
余弦
相似度之后,我还在做其他
的
操作。
浏览 21
提问于2021-08-03
得票数 0
5
回答
余弦
相似性
与Levenshtein距离
、
、
、
我想知道他们
之间
的
区别是什么,在什么情况下他们工作得最好?
余弦
相似是度量内积空间中
两个
非零向量
之间
相似性
的
度量,它度量了它们
之间
夹角
的
余弦
。0°
的
余弦
为1,对于(0,π)半径
的
任意角度都小于1。
列
文希廷距离是一个用于测量
两个
序列
之间
差异
的
字符串度量。非正式
浏览 0
提问于2019-11-18
得票数 5
回答已采纳
3
回答
Scala星火中
两个
稀疏向量
的
余弦
相似性
、
、
我有一个有
两个
列
的
dataframe
,其中每一行都有一个稀疏向量。我试图找到一种适当
的
方法来计算每一行中
两个
向量
的
余弦
相似性
(或仅仅是点积)。 创建一个k×n矩阵,其中n个项被描述为k维向量.要将每一项表示为k维向量,可以使用ALS表示潜在因子空间中
的
每个实体。这个空间(k)
的
维数可以由你来选择。使用colum
浏览 1
提问于2018-12-15
得票数 2
1
回答
两个
不同
DataFrame
的
列
之间
的
余弦
相似性
、
、
、
、
我想计算
两个
DataFrame
之间
的
余弦
相似度(对于
不同
的
大小),并将结果存储在新数据中。
浏览 72
提问于2021-08-02
得票数 0
1
回答
余弦
相似-缺点作为推荐引擎?
、
、
、
、
我见过在K-最近邻算法中使用
余弦
相似性
来生成基于用户偏好
的
推荐。在这些模型中,将给定产品
的
用户等级作为向量,然后由
两个
向量
之间
的
余弦
相似度来确定
两个
用户
之间
的
相似度。在我看来,有
两个
用户可以拥有完全极高
的
评级偏好,但如果他们有平行(但
不同
的
)偏好,那么就会生成一个
余弦
相似度为1。例如,如果一个用户将5部电影评为
浏览 2
提问于2014-10-07
得票数 1
回答已采纳
1
回答
PYSPARK:如何找到火花放电数据图中两
列
的
余弦
相似性
?
、
、
如何找出火花放电数据中两
列
之间
的
余弦
相似性
?假设我有一个火花数据+--+--||2 |5 |+--+--+cosine_similarity
浏览 4
提问于2017-05-09
得票数 2
1
回答
DataFrames上
的
Apache Spark Python
余弦
相似度
、
、
、
、
对于推荐系统,我需要计算整个Spark
DataFrame
的
所有
列
之间
的
余弦
相似度。在Pandas中,我经常这样做:import pandas as pd metrics.pairwise.cosine_similarity(df.T,df.T) 这会生成
列
<e
浏览 3
提问于2017-05-12
得票数 13
2
回答
计算
两个
对象列表
之间
的
相似度
、
、
、
我想计算
两个
不同
长度
的
列表
之间
的
相似度。特别是,
相似性
必须考虑到
不同
的
条件:一般情况下,如果B包含A,则
相似性
(A,B)->1。但是,
相似性
度量还应考虑
两个
列表中元素
的
数量。(例如,如果A包含1000个对象,而B只包含一个对象,则相似度( A,B)->0)。 -Similarity(A,
浏览 1
提问于2018-03-01
得票数 0
2
回答
可以仅使用非空值在行
之间
使用
余弦
相似性
吗?
、
、
我想要找到一个查询行和另外10个行
之间
的
余弦
相似度(或者欧几里得距离,如果更容易)。这些行都是nan值,因此如果
列
是nan,则忽略它们。因此,我只想得到查询
的
每个非空
列
与df
列
中
的
行
之间
的
余弦
相似性
。因此,对于df中
的
第0行,B和F在查询和df中都是非空
的
。提前感谢
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
1
回答
什么时候用
不同
的
单位加数字才有意义呢?
给定
两个
包含
不同
性质/单位
的
数
的
向量(例如长度(米)和重量(公斤)),计算这
两个
向量
之间
的
欧氏距离或
余弦
相似性
是否有意义?这些方程意味着你必须添加meters^2和kilometers^2,这应该是没有意义
的
。然而,我多次间接地看到这一点,例如,在基于TF-国防军(包含具有
不同
性质
的
对象
的
向量)
的
文档
的
余弦</
浏览 0
提问于2021-03-25
得票数 2
回答已采纳
1
回答
使用
Dataframe
的
行间火花
余弦
距离
、
、
、
我必须计算每一行
之间
的
余弦
距离,但我不知道如何使用Spark,Dataframes优雅地实现它。这样做
的
目的是计算每一行(项目)
的
相似性
,并通过比较行间
的
相似性
来获取前10个相似点。->这是项目-项目推荐系统
的
需要。 我所读到
的
都是关于
列
的
计算
相似性
,有人说,是否可以使用PySpark
Dataframe
的
API或RDD来
浏览 4
提问于2017-10-10
得票数 7
回答已采纳
1
回答
Python上下文中
两个
词
的
余弦
相似性
、
我试图在python中执行文本数据集中
的
两个
单词
之间
的
余弦
相似性
(每个文本代表一个tweet)。我想根据它们放置
的
上下文来评估它们
的
相似性
。trsfm.toarray(), columns = vectorizer.get_feature_names(), index = corpus)结果是文本
之间
的
相似性
,但我希望
浏览 2
提问于2022-07-07
得票数 0
回答已采纳
1
回答
tf-以色列国防军
不同
长度
的
文件
、
、
、
当文档长度非常
不同
时(例如,文档长度从500字到2500字不等),我搜索了关于规范tf等级
的
网页。 我发现
的
唯一
的
规范化讨论是将术语频率除以文档
的
长度,从而导致文档
的
长度没有任何意义。但是,这种方法对tf
的
规范化来说是非常糟糕
的
方法。如果有的话,这会导致每个文档
的
tf等级有很大
的
偏差(除非所有文档都是从几乎相同
的
字典中构造
的
,而使用tf-国防军时则不是这样)。例如,让我们拿
浏览 2
提问于2016-09-26
得票数 10
回答已采纳
1
回答
余弦
相似度与
余弦
距离
的
区别
、
、
、
它看起来像scipy.spatial.distance.cdist
余弦
相似距离:
不同
于sklearn.metrics.pairwise.cosine_similarity,后者是 有人知道为什么会有
不同
的
定义吗?
浏览 1
提问于2019-10-15
得票数 13
回答已采纳
5
回答
余弦
相似度与点积
的
距离度量
看起来,
两个
特征
的
余弦
相似性
仅仅是它们
的
点乘积,它们
的
大小
的
乘积。
余弦
相似性
是什么时候比点积更好
的
距离度量?也就是说,在
不同
的
情况下,圆点乘积和
余弦
相似性
是否有
不同
的
优缺点?
浏览 0
提问于2014-07-15
得票数 80
回答已采纳
1
回答
如何删除带有副本警告
的
设置?
、
如何避免在将
两个
数据序列
的
余弦
相似性
值与
dataframe
spotify_df
的
列
“spotify_df”
的
余弦
相似性
值进行关联时设置副本警告,这是否是我应该担心
的
问题。P.S:user_track_df只有1行,spotify_df大约有6000行,两者
的
列
数相等。
浏览 1
提问于2022-05-24
得票数 0
回答已采纳
1
回答
是否标准化word向量和文档向量
之间
的
相似性
?
、
、
、
、
余弦
相似度被广泛用于度量
两个
向量
之间
的
相似性
,其中
两个
向量可以是单词向量或文档向量。。当
两个
向量
之间
的
余弦
相似度为0.78xxx时,
浏览 2
提问于2018-05-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
余弦相似度算法进行客户流失分类预测
手把手教学,利用Python构建一个简单的推荐系统
外国网友如何使用机器学习将邮件分类?其实很简单
相似性与相关性度量
肝了3天,整理了90个Pandas案例
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券