腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1788)
视频
沙龙
1
回答
函
数来
查找
仅
使用
非
空
公共
列
的
行
之间
的
余弦
相似
度
python
、
pandas
、
function
、
trigonometry
我想编写一个函数,通过
仅
使用
公共
列
来
查找
索引
行
(查询)和数据帧中每隔一
行
之间
的
余弦
相似
度
。我面临
的
问题是,
行
之间
常见
的
非
空
列
可能不同。我已经尝试用0来替换这些值,就像我之前问过类似问题时所建议
的
那样,但这不是我正在寻找
的
输
浏览 8
提问于2019-02-20
得票数 0
回答已采纳
2
回答
可以
仅
使用
非
空
值在行
之间
使用
余弦
相似
性吗?
python
、
pandas
、
trigonometry
我想要找到一个查询
行
和另外10个
行
之间
的
余弦
相似
度
(或者欧几里得距离,如果更容易)。这些行都是nan值,因此如果
列
是nan,则忽略它们。因此,我只想得到查询
的
每个
非
空
列
与df
列
中
的
行
之间
的
余弦
相似
性。因此,对于df中
的
第0
行</em
浏览 0
提问于2019-02-11
得票数 5
回答已采纳
1
回答
数据框中行
的
余弦
相似
度
r
、
data-analysis
、
analysis
、
cosine-similarity
我有一个数据集,其中每一
列
都有给定对象
的
不同参数
的
概率。第一
列
是指示对象名称
的
字符串,而其他所有
列
都有一个数值。 我
使用
'coop‘包中
的
cosine()函
数来
查找
对象
之间
的
余弦
相似
度
。理想情况下,我希望函数将每一
行
解释为单独
的
向量,并给出每个对象
之间
的</
浏览 34
提问于2020-04-07
得票数 0
2
回答
如何度量两幅图像
之间
的
余弦
相似
度
matlab
、
similarity
、
image-recognition
我有一个由5张图像组成
的
群体矩阵,其中有49个提取
的
显着性特征。我想在Matlab中计算具有相同提取特征
的
测试图像
之间
的
余弦
相似
度
49。
浏览 4
提问于2014-03-16
得票数 4
回答已采纳
1
回答
用Python计算
余弦
相似
度
text
、
machine-learning
、
scikit-learn
、
cosine-similarity
我编写了以下代码来计算一些预处理文档
之间
的
余弦
相似
性(停止字删除、词干词干和术语频率-逆文档频率)。
浏览 1
提问于2017-02-01
得票数 0
2
回答
我可以获得Word2Vec和Doc2Vec矩阵来计算
余弦
相似
度
吗?
python
、
gensim
、
word2vec
、
doc2vec
我正在处理文本数据,目前我已经将我
的
数据放入术语文档矩阵中,并计算出TF,术语频率和TF-IDF,术语频率与文档频率相反。从这里看,我
的
矩阵如下所示:
行
名=单词我不清楚我是否有像TF和TF-IDF中那样
的
词嵌入。我希望
使用
浏览 3
提问于2019-07-11
得票数 0
1
回答
Scipy稀疏矩阵在
余弦
相似
性方面不能有效地存储
python
、
scipy
、
out-of-memory
、
sparse-matrix
我正在尝试
使用
scipy稀疏矩阵实现
余弦
相似
度
,因为我在
使用
正常矩阵(
非
稀疏)时遇到了内存错误。然而,我注意到当输入矩阵(观察值)较大时,稀疏和
非
稀疏矩阵
的
余弦
相似
度
的
内存大小(以字节为单位)几乎相同。我是不是做错了什么,或者,有没有办法解决这个问题?这里
的
代码中,输入有5%为1,95%为0。np.size(A)) print('memory perce
浏览 0
提问于2018-12-10
得票数 1
2
回答
修正
的
余弦
相似
效率
python
、
arrays
、
numpy
、
scikit-learn
、
scipy
问题所在 我试图计算两个数组
之间
的
余弦
相似
度
,但基本公式略有变化。也就是说,我只关心与“引用”数组重叠
的
组件。例如,如果我们要计算以下两个数组
之间
的
余弦
相似
度
: A = [1 0 1] B = [1 1 0] [0 1 1] [0 1 1] 假设B是引用数组。然后,A将相对于B中
的
每一
行
进行更改,以
仅
包含与该行重叠
浏览 28
提问于2019-10-15
得票数 0
回答已采纳
2
回答
如何在Python中对dict
的
值进行聚类?
python
、
python-2.7
、
dictionary
、
hierarchical-clustering
基本上,我在Python中有一个dict,它
使用
字符串键和int数组作为值。[4, 1, 5, 2, 4], ....我想在这个字典上实现基于值
的
交集
的
层次聚类例如,假设Option1Results和Option4Results共享大约70%
的
相同整数,然后将它们聚集在一起。除了遍历字典并逐个比较值之外,还有什么方法可以做到这一点吗?
浏览 10
提问于2017-07-25
得票数 1
1
回答
如何高效地解码PyTorch中
的
嵌入?
python
、
artificial-intelligence
、
pytorch
、
rnn
我是Pytorch和RNN
的
新手。我正在学习如何
使用
RNN预测数字,作为视频中
的
教程:out_unembedded = out.view(-1, hidden_size) @ embedding.weight.transpose(0,1)out_unembedded = out.view(-1, hidden_size).dot( embedding.weight.transposer
浏览 0
提问于2018-01-02
得票数 1
1
回答
将自定义函数应用于熊猫数据文件中
的
每个
列
组合
python
、
pandas
、
dataframe
、
lambda
我试着计算出熊猫数据中每一个
列
组合
之间
的
余弦
相似
性。我编写了一个自定义函
数来
计算
余弦
相似
度
,现在需要将它应用于每一对组合
列
。如果用户没有与其交互,则每
列
包含0,如果用户与之交互,则包含1。因此,每一
行
都包含用户
的
总体查看行为。 目前
使用
的
是for循环,但是对于较大
的
数据样本来说太慢了-例如,我当前
的</
浏览 0
提问于2019-07-24
得票数 1
回答已采纳
1
回答
Spark ml cosine
相似
度
:如何获得1到n
的
相似
度
分数
scala
、
apache-spark
、
apache-spark-mllib
、
cosine-similarity
、
apache-spark-ml
我读到我可以
使用
RowMatrix附带
的
columnSimilarities方法来
查找
各种记录(基于内容)
的
余弦
相似
度
。dileep manju现在,我已经创建了一个spark-ml管道来计算上面的文本特征(流派,演员)
的
tf-idf,并在我
的
管道中
使用
VectorAssembler将这两个特征组装成一个单独
的
列
" features“
浏览 3
提问于2016-10-18
得票数 5
1
回答
计算两个pandas
列
之间
的
向量
的
余弦
相似
度
?
python-3.x
、
cosine-similarity
我有以下Pandas Dataframe,需要按
行
查找
余弦
相似
度
。但是我
的
代码返回一个值矩阵。我需要有一个额外
的
列
和每行
的
余弦
值
的
输出。
浏览 34
提问于2019-08-22
得票数 0
1
回答
两个火花源数据帧
的
余弦
相似
度
python
、
apache-spark
、
pyspark
、
apache-spark-sql
15 .17 .14 18 .86 .09 CustomerID CustomerID CosineCustVal CosineCustVal 15 12 1
浏览 2
提问于2018-09-28
得票数 1
1
回答
两次辐射
的
余弦
相似
性
python
、
arrays
、
python-2.7
、
numpy
实际上,我在数组1中存储了200维向量表示
的
100个样本,在数组2中存储了140个200维向量
的
样本。 现在,我要计算样本
之间
的
相似
度
向量,并创建一个
相似
矩阵。对于每个样本,我想计算每个字段组合
之间
的
相似
性,并将其存储起来,这样我就可以得到一个15000*24维
的
数组。前150
行
是第1
列
和150
行
数组2
之间
的
<
浏览 1
提问于2018-04-17
得票数 1
回答已采纳
2
回答
在numpy python中从稀疏矩阵生成密集矩阵
python
、
arrays
、
numpy
、
scipy
、
sparse-matrix
我有一个Sqlite数据库,其中包含以下类型
的
模式:此表包含文档中
的
术语及其各自
的
计数。(docn,term1 , 10) 这个矩阵可以被认为是稀疏矩阵,因为每个文档包含
的
项非常少,它们将具有
非
零值。我如何
使用
numpy从这个稀疏矩阵创建一个密集矩阵,因为我必须
使用
余弦
相似
度
计算文档
之间
的
相似
<e
浏览 1
提问于2013-05-12
得票数 49
回答已采纳
1
回答
文档
相似
性自抄袭
r
、
quanteda
我有来自100个不同作者
的
数千个小文档。
使用
quanteda软件包,我计算了作者与自己
之间
的
余弦
相似
度
。例如,作者x有100个文本,所以我得出了一个100 x 100
的
相似
度
矩阵。作者y有50篇文章,所以我想出了一个50 x 50
的
相似
度
矩阵。 现在我想比较一下这两位作者。换句话说,哪一位作者更多地抄袭自己?如果我取
列
或
行
<em
浏览 1
提问于2017-01-29
得票数 1
2
回答
如何计算两种不同鱼群间
的
余弦
相似
度
?
python
、
nlp
、
nltk
、
spacy
、
gensim
我试图估计语料库A中
的
每个文档A和语料库B中
的
所有文档
之间
的
余弦
相似
性。 知道我怎么能高效地做这件事吗?我正在处理相当大
的
数据集。本质上,我希望在语料库B中获得文档,这对于A中
的
每个文档来说都是非常
相似
的。
浏览 8
提问于2020-04-09
得票数 1
3
回答
Jaccard
相似
与
余弦
相似
的应用与区别
similarity
Jaccard
相似
度
和
余弦
相似
度
是比较项目
相似
性时常用
的
两种度量方法。然而,在哪种情况下哪一种比另一种更可取,我并不十分清楚。有人能帮助澄清这两种测量方法
的
差异(概念或原理
的
差异,而不是定义或计算)及其更好
的
应用吗?
浏览 0
提问于2015-02-12
得票数 39
回答已采纳
1
回答
生成包含R中成对
余弦
相似
性值
的
列表
r
、
list
、
loops
、
cosine-similarity
我正在尝试编写一个循环来测量来自值矩阵
的
任意两
行
之间
的
成对
相似
性,其中每行包含来自5个人(包括他/她自己)
的
个人评估
的
4个回答: M <- matrix( nrow=5, ncol=4) 我想
使用
余弦
相似
浏览 17
提问于2021-04-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据Mahout中相似度的几种算法介绍,内含Mahout相关资料
【Excel技巧】Day8:每天一个Excel使用小技巧,Excel用的好,天天都能下班早!
数据挖掘干货总结(一)-NLP基础
碟中谍这么火,我用机器学习做个迷你推荐系统电影
机器学习基础:相似度和距离度量究竟是什么
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券