腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
熊猫数据框中的余弦相似行
connect timed out
相关搜索:
数据框中行的余弦相似度
文档(行)之间的余弦相似度- spark
如何识别数据框中的相似行?
基于所选pandas列的行的余弦相似度
在pandas数据帧中获取成对余弦相似度
内存错误python中的TFIDF余弦相似度
Spark dataframe中列之间的余弦相似度
R中的错误:余弦相似度和MDS
如何检查数据框之间行元素的相似性
如何在熊猫数据框的顶部添加一行?
spark dataframe (scala)中tf idf输出的余弦相似度
如何在数据框中根据列值选择相似的行
如何找出熊猫数据框的特征?
生成包含R中成对余弦相似性值的列表
计算大数据框上某列中所有对的余弦相似度
函数来查找仅使用非空公共列的行之间的余弦相似度
从熊猫数据框中绘制轨迹数据的热图
我如何在熊猫的数据框中绘制箭头?
删除熊猫中包含“?”的行。
在lucene中获得两个文档之间的余弦相似度
相关搜索:
数据框中行的余弦相似度
文档(行)之间的余弦相似度- spark
如何识别数据框中的相似行?
基于所选pandas列的行的余弦相似度
在pandas数据帧中获取成对余弦相似度
内存错误python中的TFIDF余弦相似度
Spark dataframe中列之间的余弦相似度
R中的错误:余弦相似度和MDS
如何检查数据框之间行元素的相似性
如何在熊猫数据框的顶部添加一行?
spark dataframe (scala)中tf idf输出的余弦相似度
如何在数据框中根据列值选择相似的行
如何找出熊猫数据框的特征?
生成包含R中成对余弦相似性值的列表
计算大数据框上某列中所有对的余弦相似度
函数来查找仅使用非空公共列的行之间的余弦相似度
从熊猫数据框中绘制轨迹数据的热图
我如何在熊猫的数据框中绘制箭头?
删除熊猫中包含“?”的行。
在lucene中获得两个文档之间的余弦相似度
页面内容是否对你有帮助?
有帮助
没帮助
相关·
内容
文章
问答
(9999+)
视频
沙龙
1
回答
熊猫
数据
框
中
的
余弦
相似
行
、
、
、
我有一个CSV文件,其内容如下,我想从CSV文件
中
剩余
的
ID计算
余弦
相似
度。我已经将它加载到一个
熊猫
数据
框
中
,如下所示: old_df['Vector']=old_df.apply(lambda row: np.array(np.matrix(row.Vector但是,我不知道如何找到哪个GUID (或ID)与其他GUID (或ID)
相似
,我只想获得前k个具有最高
相似
分数
浏览 3
提问于2020-12-22
得票数 2
回答已采纳
1
回答
计算2
行
向量
的
cos
相似
性,并不是所有成对
的
cdists
、
、
我有两个
熊猫
df触发器和动作,其中包含25维
的
特征向量写入行,并希望在相应
的
行
之间
的
余弦
相似
性。下面的代码生成成对
余弦
相似
性
的
20675 x 20675矩阵:(20675, 25)(20675, 25)result = cdist(trigger, action, metric='c
浏览 1
提问于2018-04-15
得票数 0
回答已采纳
1
回答
在Pyspark
中
查找相关
的
文档名称
、
、
我有一个包含两列(id,name)
的
数据
框
。名称列具有相关
的
名称。例如,术语,相关术语,相关
行
,
行
。 我想在不同
的
行
中找到
相似
的名字。我已经尝试了
余弦
相似
度,但无法实现这一点。寻找使用pyspark在不同行
中
获取相关名称
的
方法。
浏览 11
提问于2018-02-23
得票数 0
1
回答
如何解释python
中
的
余弦
相似
输出
、
、
、
我有一个
熊猫
DataFrame df,列有:userID、 have 、SEI、name。, ..., 0.16648431, 0.16403693, 0.17438159], userID 3患者
的
体重为125.0,SEI为0.562140。名为 263的人
的
体重为125.0,SEI为0.562140。(我必须为名称列使用标签编码器,因为在不更改列
数据
类型
的
情况下无法运行
余弦
相似
函数。希望这不会影响最终目标吗?)目标是使用所有
行
上<
浏览 9
提问于2020-08-28
得票数 0
回答已采纳
2
回答
是否可以使用具有
余弦
相似
性
的
KDTree?
、
、
例如,我似乎不能用sklearn KDTree来使用这个
相似
性度量,但我需要使用,因为我使用
的
是测量单词向量
相似
性
的
方法。对于这种情况,什么是快速鲁棒定制算法?我知道Local Sensitivity Hashing
的
情况,但它应该经过大量
的
调试才能找到params。
浏览 0
提问于2016-12-12
得票数 2
回答已采纳
2
回答
如何实现
余弦
相似
度计算
的
并行化
、
、
、
、
我通过读取一个目录中大量文件生成了一个很大
的
数据
帧。我已经设法并行化了在解析
中
读取文件
的
部分。我获取该
数据
并为下一步生成
数据
帧。这是计算
相似
度矩阵。 现在,我正在尝试计算
数据
框
的
行
之间
的
余弦
相似
度。由于它是一个大
数据
帧,它需要很长时间(几个小时)才能运行。我如何并行化这个进程。这是我当前计算
余弦
相似</
浏览 0
提问于2015-03-16
得票数 2
2
回答
在每一
行
上使用函数返回新
的
数据
框
、
、
我有一个超过1000
行
的
大
数据
帧。我能够使用
余弦
相似
度找到与某个索引最
相似
的
行
,并相应地对它们进行加权。所以我
的
similar_rows
数据
框
看起来像这样...: A B C Weight1 8 3 2 0.3 2 1 4 6 0.1 我将每个值乘以权重列,然后找到所有
行
的
平均值,因此我<em
浏览 12
提问于2019-02-25
得票数 0
2
回答
无圈大
熊猫
余弦
相似
性
的
逐行计算
、
、
、
、
我有一只有很多行
的
熊猫
。对于每一
行
,我想要计算
行
的
A列(第一个向量)和
行
的
列B(第二个向量)之间
的
cosinus
相似
性。最后,我
的
目标是得到每一
行
都有一个
余弦
相似
度值
的
向量。有人能给我一些关于这个代码
的
反馈吗?非常感谢!df[df.index==row][columnsB]) df['cos_sim']=c
浏览 5
提问于2020-06-12
得票数 1
回答已采纳
2
回答
如何在有新向量
的
预计算矩阵
中
求
余弦
相似
度?
、
、
、
、
我有一个包含5000项(
行
)和2048个特性(列)
的
dataframe。 我
的
数据
形状是(5000,2048),当我用滑雪板
中
的
成对距离计算
余弦
矩阵时,得到了(5000,5000)矩阵。但是现在,如果我有一个新
的
(1,2048)
的
向量形状,如何利用我已经计算过
的
(5000,5000)
余弦
矩阵,找到这个项目与我所拥有的早期
数据
的
余弦
相似</
浏览 7
提问于2019-11-26
得票数 0
1
回答
用于稀疏矩阵计算
的
枕木还是
熊猫
?
、
、
、
我必须计算稀疏矩阵
中
向量之间
的
大量
相似
计算。当前用于此任务
的
最佳工具scipy-sparse或pandas是什么?
浏览 5
提问于2013-10-04
得票数 2
1
回答
使用R发现
数据
帧之间
的
余弦
相似
度
、
、
我有两个
数据
框
包含来自不同医院
的
信息。第一个具有登革热可能病例
的
数量,第二个具有每周提供
的
dengues.The
数据
的确诊病例
的
数量。我有长达53周或一年
的
数据
。verified cases) xyz 3 11两个
数据
框在相应
行
中</em
浏览 3
提问于2016-01-07
得票数 0
1
回答
词向量上numpy数组
的
分组和聚合问题
、
、
、
、
我
的
熊猫
数据
框架是这样
的
: 1 "text" 4 [100dimensional vector] 我正在尝试运行一个doc2vec实现,我希望能够按照电影ids和wordEmbeddingVector
中
向量之和进行分组,并计算我尝试
的
求和向量和输入向量之间
的
余弦
相似
度所以我试
浏览 0
提问于2016-06-02
得票数 0
回答已采纳
2
回答
函数在R
中
的
数据
帧列表
中
的
应用
、
、
、
我有一个
数据
帧列表,每个
数据
帧都有一个三维向量(3列)
的
行
。我想计算每个
数据
帧(例如,第1
行
和第2
行
、第2
行
和第3
行
、第3
行
、第3
行
和第4
行
等)
的
每一对后续
行
的
余弦
相似
性(lsa:: cosine )。我如何循环遍历列表
中
的
每个
数据
帧,以计
浏览 3
提问于2022-08-17
得票数 2
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、文本
数据
集之间
的
相似
之处。分别使用了
余弦
相似
度、软
余弦
相似
度和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于
余弦
相似
度和软
余弦
相似
度,我猜
相似
度是向量之间
的
余弦
。我说
的
对吗? 在Gensim文档
中
,他们写道,这是语义<em
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
2
回答
可以仅使用非空值在行之间使用
余弦
相似
性吗?
、
、
我想要找到一个查询
行
和另外10个
行
之间
的
余弦
相似
度(或者欧几里得距离,如果更容易)。这些行都是nan值,因此如果列是nan,则忽略它们。因此,我只想得到查询
的
每个非空列与df列
中
的
行
之间
的
余弦
相似
性。因此,对于df
中
的
第0
行
,B和F在查询和df中都是非空
的
。 然后,我想打印每行
的
余弦<
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
2
回答
多个列值
的
余弦
相似
度
、
、
、
、
1 1 0 3 2133 3 0 0 1 我有一个包含多个列值
的
数据
集,其中每一
行
代表一个对象。我想计算所有
行
之间
的
余弦
相似
度,以便考虑所有因素,大小、numberOfPlants、阳台(布尔值)、可用(布尔值)和publicTransport (布尔值)具有相同
的
权重。如果我输入一个id,我想要返回看起来最
相似
的
行<
浏览 30
提问于2021-03-16
得票数 0
回答已采纳
3
回答
Python:
余弦
相似
度m*n矩阵
、
、
、
我有两个M×N矩阵,这是我从图像中提取
数据
后构造
的
。这两个向量都有很长
的
第一
行
,在第三
行
之后,它们都只成为第一列。例如,原始向量如下所示12,4,5,5,1,2这两个向量都有类似的模式,前三
行
有很长
的
行
,然后随着进程
的
进行而变得稀疏。做
余弦
相似
度,我在考虑使用填充技术来添加零,并使这两个向量N×N。我查看了
余弦
浏览 1
提问于2012-07-10
得票数 1
回答已采纳
1
回答
文本
数据
的
欧几里德和
余弦
、
、
、
、
如果我使用tf-以色列国防军特征表示(或者只是文档长度归一化),那么欧几里得距离和(1 -
余弦
相似
性)基本上是一样
的
吗?所有我读过
的
教科书和其他论坛,讨论说
余弦
相似
更适合文本.我编写了一些基本代码来测试这一点,并发现它们确实是可比较
的
,不是完全相同
的
浮点值,但它看起来像一个缩放
的
版本。下面给出了两种
相似
的简单演示文本
数据
的
结果。课文2号是一个大行约50字,其余都是小10字
行
浏览 2
提问于2015-04-27
得票数 0
回答已采纳
1
回答
如何搜索没有tf-以色列国防军和成对
相似
性
的
文档?
、
、
、
、
我试图建立一个基于Tf-以色列国防军和
熊猫
与滑雪成对
相似
的文本文件搜索工具。我有一个文本文件或网页,我可以刮,我将使用它来建立我
的
初始语料库。然后,我制作了一个
熊猫
的
数据
,并对文件进行了一些预测。 然后,我为我
的
语料库建立了训练我
的
TfidfVectorizer和矩阵。然后,我用我正在搜索
的
文本创建第二个
数据
,对其进行预处理,并根据先前训练过
的
向量器构建第二个
浏览 1
提问于2018-03-20
得票数 0
回答已采纳
3
回答
Python cosine_similarity不适用于NaNs
的
矩阵
、
、
、
、
需要找到python函数,其工作方式类似于R func:即,通过逐对计算
数据
行
之间
的
余弦
距离来寻找
相似
矩阵如果NaNs存在,则应该在这2
行
中
删除带有NaNs的确切列。 upd.我还尝试从中删除循环中每对
行
中
的
,使用
余弦
func。它给出了与R相同
的
结果,但工
浏览 0
提问于2019-01-17
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中如何去掉数据框的前两行数据
使用Python更改数据框中的指定列
大数据Mahout中相似度的几种算法介绍,内含Mahout相关资料
新年Flag:搞定Python中的“功夫熊猫”,做最高效的数据科学家
如何防止数据质量知识库中是否有历史的相同或相似的现象发生?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券