腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1967)
视频
沙龙
1
回答
如
何在
python
中找到
正确
的
向量
/
数组
相似
度
?
python
、
scikit-learn
、
scipy
、
similarity
、
cosine-similarity
我正在尝试找到一种合适
的
方法来比较两个
数组
/
向量
,不是基于直接
的
布尔比较,而是基于比例或梯度0,1。最接近
的
是余弦
相似
度
,但即使是这样,似乎也不是我想要
的
。但是对于像这样
的
情况: from scipy import spatial b = np.array([1,2,3,4,5]) print(1 -spatial.distance.cosine(a,b)) 它不应该给
浏览 87
提问于2021-09-25
得票数 0
2
回答
如
何在
MATLAB中计算两个频率
向量
之间
的
余弦
相似
度
?
matlab
、
vector
、
cosine-similarity
我需要在MATLAB
中找到
两个频率
向量
之间
的
余弦
相似
度
。a = [2,3,4,4,6,1]如
何在
MATLAB中度量这些
向量
之间
的
余弦
相似
度
?
浏览 40
提问于2019-07-25
得票数 1
2
回答
Python
中
的
术语文档矩阵和余弦
相似
度
python
、
numpy
、
scipy
、
term-document-matrix
我想使用
Python
来解决以下情况(最好使用numpy和scipy): 如
何在
Python
中实现这一点?我知道我可以使用scipy.sparse.coo_matrix将文档表示为稀
浏览 3
提问于2013-08-07
得票数 3
回答已采纳
1
回答
在自然语言处理(NLP)中,如何进行有效
的
降维?
text
、
machine-learning
、
nlp
、
dimensionality-reduction
、
dimension-reduction
在NLP中,通常情况下,特征
的
维度非常大。例如,对于手头
的
一个项目,特征
的
维度几乎是20,000 (p = 20,000),并且每个特征都是一个0-1整数,以显示论文中是否存在特定
的
单词或二元语法(一篇论文是R^{p}$中
的
数据点$x \)。我知道特征之间
的
冗余
度
很大,所以降维是必要
的
。我有三个问题: 1)我有10,000个数据点(n = 10,000),每个数据点有10,000个特征(p = 10,000)。进行降维
的
有效方法是什么
浏览 13
提问于2014-11-21
得票数 6
1
回答
在
Python
中测量
向量
化字数
的
两个
数组
之间
的
距离
arrays
、
dataframe
、
numpy
、
cosine-similarity
、
sentence-similarity
我有一个dataframe,它有一个列,它是标记化(标记化后句子
的
单词)
向量
化
的
结果,而this列由不同维数
的
数组
组成,我想计算dataframe中所有这些
数组
与输入
数组
之间
的
相似
度
,这也是不同维数
的
,我如
何在
python
中做到这一点?
浏览 12
提问于2021-03-09
得票数 0
3
回答
python
中
的
相似
度
匹配计算
python
我正在做一个用
python
进行问答
的
项目。我已经有了问答文档
的
向量
和tfidf
的
值。但是我不知道如
何在
python
中计算
相似
度
匹配。
浏览 2
提问于2012-05-20
得票数 0
3
回答
非常大数据集
的
余弦
相似
性
python
、
numpy
、
dataframe
、
cosine-similarity
每个
数组
都非常适合我
的
记忆,但我在np.dot()内部调用期间得到了np.dot()我
的
最终目标是得到与父
向量
有很高余弦
相似
性
的
顶级N个子
向量
(包括它们
的
名字,
如
child_vector_1和相应
的
余弦分数)。(如上面的数据所示) 步骤3:生成一个元组列表来存储key (
如
child_vector_1 )和值(
如</em
浏览 0
提问于2018-12-20
得票数 5
1
回答
可以在Keras中
的
CNN之前添加双向LSTM吗?
python
、
tensorflow
、
keras
、
deep-learning
、
lstm
我目前正在开发一个系统,该系统可以对两个句子是否具有相同
的
内容进行分类。为此,我使用了预训练
的
词
向量
,因此有一个包含句子一
的
词
向量
的
数组
(s1)和一个包含句子二
的
词
向量
的
数组
(s2)。为了对它们是否
相似
进行分类,我通过将s1中
的
所有
向量
与s2中
的
向量
进行成对比较来创建一个矩阵。然后将该矩阵输入到CNN分类器中,
浏览 1
提问于2018-10-11
得票数 0
1
回答
如
何在
Java或JSP中实现Jaccard索引?
java
、
mysql
、
jsp
、
similarity
我在计算Jaccard
相似
度
时遇到了这个问题,以便使用销售交易
的
MySQL数据库中
的
交易id来查找
相似
的书籍:t2= Java、C#、
Python
....etcJaccard
相似
度
=(交集/并集)= 2/3 但我不明白如何才能找到这两个
向量
浏览 4
提问于2013-03-06
得票数 2
1
回答
一个恰当
的
向量
相似
度
指标
math
、
vector
、
similarity
我正在尝试调整余弦
相似
度
,以确定两个
向量
相对于条目的
相似
度
。由于所获得
的
度量在
向量
尺度{(0,1,2)和(0,2,4)具有余弦
相似
度
1}下是不变
的
,那么扩展
相似
性度量以说明初始
向量
尺度
的
方法是什么?我想乘以min{|v1|,|v2|}/max{|v1|,|v2|},其中|v|表示
向量
v范数,以保持-1和1
的
界限。任何建
浏览 2
提问于2012-01-06
得票数 1
回答已采纳
1
回答
如
何在
python
中由图节点
的
边缘列表生成
的
向量
之间找到余弦
相似
性?
python-3.x
、
vector
、
data-mining
、
cosine-similarity
我想从一个给定
的
向量
嵌入文件中计算出一些图节点
的
余弦
相似
度
分数。现在如何计算
python
中每个节点
的
得分?我相信用科学工具-学习,我们能解决这个问题。我期望输出显示每个节点
的
余弦
相似
度
评分。 2 -> 0.4 . .我很
浏览 1
提问于2019-07-22
得票数 0
1
回答
基于k-均值聚类和余弦
相似
度
的
TF-下手特征
向量
加权
python
、
machine-learning
、
scikit-learn
、
k-means
、
tf-idf
我有一组TF-以色列国防军特征
向量
。我想使用两种方法在
数组
中找到
相似
的
向量
: 使用Scikit学习,这个过程非常简单。现在我想对某些特性进行加权,这样它们比其他特性对结果
的
影响更大。例如,我想对TF-国防军
向量
的
前100个元素进行加权,以便这些特征比其他特征更能表示
相似
性。我如
何在
我
的
特征
向量
中有意义地加权某些特征?对于我上
浏览 1
提问于2015-09-22
得票数 1
1
回答
如何改进具有语义
相似
性
的
向量
空间模型?
nlp
、
word2vec
、
vector-space-models
我试图构建一个经典
的
查询系统,通过计算可能答案
的
归一化文本
的
TFIDF
向量
的
余弦
相似
性,为查询找到最可能
的
候选文本。如果查询和候选文本包含相同(规范化)单词,则此操作非常好。我
的
系统
正确
地从语料库
中找到
了以下最接近
的
答案:到现在为止还好。我
的
问题是,如果问题
的
含义相同,但
浏览 0
提问于2017-06-22
得票数 -1
1
回答
理解不同尺寸张量上
的
广播和算术运算
python
、
pytorch
、
distance
我目前正在计算
向量
之间
的
各种
相似
性度量,比如余弦
相似
度
,欧几里德距离,马氏距离等等。由于我处理
的
向量
可能很大,所以我需要
的
计算时间最小。我很难理解如何处理不同维度
的
向量
(但是,它们确实共享一个维度),以及如
何在
PyTorch中处理这个问题。 对于v_a中
的
A中<
浏览 15
提问于2022-05-18
得票数 1
回答已采纳
1
回答
tf-idf
向量
空间中
的
ntc形式到底是什么?
python
、
nlp
、
tf-idf
我有一个文本文档
的
集合。我被要求在tf-idf
向量
空间和ntc形式中显示每个文档,然后在
python
中训练一个基于文档
向量
的
svm模型。ntc在这里到底是什么意思?我发现它与tf-idf权重相同,只需一步归一化即所谓
的
“余弦归一化”。但是我找不到关于这件事
的
信息。我发现“余弦
相似
度
”与“余弦归一化”不同。它们是一样
的
吗?我如
何在
python
中创建这个
向量
呢?
浏览 2
提问于2021-01-07
得票数 0
1
回答
根据菜谱标题推荐配料
machine-learning
、
python
、
deep-learning
、
supervised-learning
、
semi-supervised-learning
我
的
想法是,这个问题可以用建议系统来解决,但另一方面,我认为分类/聚类算法可以用于分组/类别中的菜谱划分,一旦输入标题与集群相关联,就可以从集群中生成组分,但我不知道哪一个是最好
的
解决方案,我不知道是否还有其他
的
解决方案我正在发布我
的
临时解决方案将所有数据导入数据库(在我
的
例子中是postgres),其中菜谱表只有名称,成分表有名称,ForeignKey有菜谱 一旦用户输入菜谱名称(rname),
浏览 0
提问于2018-06-03
得票数 0
回答已采纳
1
回答
理解gensim word2vec 2
的
most_similar
python
、
python-3.x
、
nlp
、
gensim
、
word2vec
我不知道该如何使用gensim's most_similar
的
Word2Vec方法。假设你想测试一个尝试过
的
、真实
的
例子:男人站在国王面前,女人站在X上;找到X。我认为这就是你可以用这个方法做
的
事情,但从我得到
的
结果来看,我认为这是不
正确
的
。 找出最
相似
的单词。积极词对
相似
性有积极
的
促进作用,消极
的
词对
相似
性有积极
的
促进作用。该方法计算给定词<
浏览 2
提问于2019-02-07
得票数 2
回答已采纳
1
回答
计算
python
矩阵列
的
余弦
相似
度
python
、
numpy
、
matrix
我有一个数值矩阵A,如下所示 [1, 2, 2]])但我不想迭代循环中
的
每一列并这样做。然而,我不确定这是
正确
的
答案。这个函数<e
浏览 1
提问于2016-06-21
得票数 0
1
回答
余弦
相似
python
问题
python
、
information-retrieval
、
cosine-similarity
、
dot-product
嗨,我正在试图计算我
的
查询和我在
python
中
的
信息检索程序返回
的
文档之间
的
余弦
相似
度
。对于余弦
相似
性,我使用以下实现:def cosine_similarity(v1,v2): foridf*国防军权重和每个文档
的
向量
,这是文档
向量
和查询
向量
的
一个例子: D:
浏览 1
提问于2014-09-24
得票数 2
2
回答
计算给定行
向量
矩阵
的
距离矩阵
matrix
、
numpy
、
distance
假设我有一个矩阵nxm,它容纳行
向量
。我想要有一个距离矩阵nxn,它表示每个
向量
之间
的
距离。当我使用Numpy时,我如
何在
Python
中做到这一点呢?我知道是Scipy干
的
,但我想弄脏我
的
手。我已经写了一个余弦
相似
度
函数cos_dist(a,b),其中a和b是两个不同
的
向量
。现在,我需要一个调用者函数,它可以有效地为每一对项目执行此操作。我该怎么做呢?
浏览 2
提问于2013-05-10
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R开发人员使用Python
NumPy能力大评估:这里有70道测试题
深度学习:必备数学知识之线性代数篇
深度学习必备数学知识之线性代数篇
论文浅尝 Question Answering over Freebase
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券