腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
文档
相似
度
的
不同方法(LDA、LSA、
余弦
)
text
、
similarity
、
lda
、
trigonometry
、
lsa
我有一组简短
的
文档(每段1到2段)。我使用了三种不同
的
文档
相似
度
方法:- tfidf矩阵上
的
简单
余弦
相似
度
-
在
整个语料库上应用LDA,然后使用LDA模型为每个文档创建
向量
,然后应用
余弦
相似
度
。
对
整个语料库
进行
-applying LSA,然后使用LSA模型为每个文档创建
向量
,然后应用
余弦
浏览 20
提问于2017-01-06
得票数 0
1
回答
使用scipy
的
各种稀疏矩阵乘积
的
性能
python
、
numpy
、
performance-testing
、
sparse-matrix
我想尝试以下方法:3.)使用doc矩阵作为coo矩阵,使用zip函数快速迭代索引(同时跟踪您所在
的
行),并在不利用ndarray
的
矢量化aspec
的</e
浏览 2
提问于2018-12-10
得票数 1
1
回答
在
pytorch
中
如何
在给
定
向量
和
余弦
相似
度
的
情况下
对
相似
向量
进行
采样
?
vector
、
pytorch
、
cosine-similarity
我有一个
向量
>>> vec 0.2890, 0.5411, 0.5319, 0.7163, 0.3166, 0.5717, 0.5018, 0.5368, 0.3321]]) 使用这个
向量
,我想生成15个
余弦
相似
度
大于80%
的
向量
。我
如
浏览 30
提问于2021-05-03
得票数 0
回答已采纳
1
回答
项目间
的
余弦
相似
性(购买数据)与标准化
recommender-system
、
apache-spark
、
pyspark
、
cosine-distance
我使用表示产品用户购买行为
的
IndexedRowMatrix,为了构建产品推荐,我使用
余弦
相似
度
来计算产品之间
的
相似
性。PySpark提供了一个名为columnSimilarities()
的
函数。我
的
问题是,
在
使用columnSimilarities()之前,是否需要规范每个产品
的
向量
?我读过关于归一化
和
余弦
相似
的文章,并且理解
余弦</e
浏览 0
提问于2018-11-19
得票数 3
1
回答
生成两个具有给定角度
的
向量
math
、
vector
、
linear-algebra
、
cosine-similarity
我试图用给定
的
余弦
相似
度
生成两个
向量
。输入将是
余弦
相似
度
的
程度(或者说它取决于它)
和
向量
中
的
维数(D),输出将是D维
的
两个
向量
,与它们之间给定
的
相似
度
,现在我知道
如何
使用
余弦
相似
函数来计算
相似
度<
浏览 6
提问于2022-05-25
得票数 1
回答已采纳
1
回答
如何
在此用例中使用
余弦
相似
度
?
statistics
、
data-mining
、
recommendation-engine
、
cosine-similarity
如果我有一个查询
向量
A
和
一个项目
向量
B,如果有人能指导我
如何
加权/归一化
向量
(同样
的
策略),那就太好了。
向量
A将具有以下分量( property1 (二进制)、property2 (二进制)、属性3(从0到50
的
整数)、property4 (从0到10
的
整数))我知道,使用
余弦
相似
度
计算这两个
向量</e
浏览 2
提问于2014-10-05
得票数 1
1
回答
两个文档之间
的
不同特征
nlp
、
nltk
、
gensim
、
cosine-similarity
我试图找出这两份文件之间
的
不同之处。我正在使用gensim,到目前为止已经获得了
相似
度
分数。 有没有办法知道两个文档之间
的
相异分数
和
相异特征?
如何
评估它?
浏览 1
提问于2018-07-03
得票数 0
2
回答
使用相同源
的
余弦
相似
和
完全不同
的
结果
python
、
machine-learning
、
cosine-similarity
、
word-embedding
、
machine-translation
我正在学习单词嵌入
和
余弦
相似
性。我
的
数据是由两组相同
的
词组成
的
,但用
的
是两种不同
的
语言。 我是否应该期望
浏览 3
提问于2019-07-24
得票数 0
回答已采纳
2
回答
自动编码器:使用
余弦
距离作为损耗函数
deep-learning
、
pytorch
、
autoencoder
我正试图训练一个自动编码器(
在
PyTorch
中
)来重建基因图谱。目前,我正在使用均方误差(MSE)损失
进行
训练:模型没有过度拟合,训练
和
验证损失都在减少。问题是原始
向量
与重构
向量
在
验证集上
的
余弦
相似
度
平均值为0.4。我想用
余弦
相似
作为损失函数,而不是MSE。在下面的链接 (幻灯片18)
中
,作者提出了以下损失: l(x_1, x_
浏览 0
提问于2019-09-10
得票数 3
1
回答
理解不同尺寸张量上
的
广播
和
算术运算
python
、
pytorch
、
distance
我目前正在计算
向量
之间
的
各种
相似
性度量,比如
余弦
相似
度
,欧几里德距离,马氏距离等等。由于我处理
的
向量
可能很大,所以我需要
的
计算时间最小。我很难理解
如何
处理不同维度
的
向量
(但是,它们确实共享一个维度),以及
如何
在
PyTorch
中
处理这个问题。 我有两个
向量
,A
和
B,其维数分别为[867, 768
浏览 15
提问于2022-05-18
得票数 1
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
python
、
text
、
gensim
、
sentence-similarity
我使用Gensim库来查找句子与段落集合、文本数据集之间
的
相似
之处。分别使用了
余弦
相似
度
、软
余弦
相似
度
和
移动测度。Gensim返回一个项目列表,包括、docid、
和
相似
性评分。对于
余弦
相似
度
和
软
余弦
相似
度
,我猜
相似
度
是
向量
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
2
回答
如何
在有新
向量
的
预计算矩阵
中
求
余弦
相似
度
?
python
、
pandas
、
machine-learning
、
scikit-learn
、
computer-vision
我有一个包含5000项(行)
和
2048个特性(列)
的
dataframe。 我
的
数据形状是(5000,2048),当我用滑雪板
中
的
成对距离计算
余弦
矩阵时,得到了(5000,5000)矩阵。但是现在,如果我有一个新
的
(1,2048)
的
向量
形状,
如何
利用我已经计算过
的
(5000,5000)
余弦
矩阵,找到这个项目与我所拥有的早期数据
的
余弦
相似</
浏览 7
提问于2019-11-26
得票数 0
1
回答
word2vec
的
余弦
相似
性大于1
python
、
apache-spark
、
pyspark
我使用spark
的
word2vec算法来计算文本
的
文档
向量
。w2vmodel.findSynonyms('science',4).show(5)| wordneuroscience|1.4968051528391833| | psychology| 1.4588656
浏览 0
提问于2016-12-29
得票数 6
1
回答
余弦
相似
-缺点作为推荐引擎?
neo4j
、
machine-learning
、
knn
、
recommendation-engine
、
cosine-similarity
我见过
在
K-最近邻算法中使用
余弦
相似
性来生成基于用户偏好
的
推荐。在这些模型
中
,将给定产品
的
用户等级作为
向量
,然后由两个
向量
之间
的
余弦
相似
度
来确定两个用户之间
的
相似
度
。(例如) 我
的
问题是:能解释使用Cosine
相似
性
的
推荐引擎是
如何
计算出并行用户偏好
浏览 2
提问于2014-10-07
得票数 1
回答已采纳
2
回答
创建给定
余弦
相似
度
的
随机
向量
python
、
numpy
、
cosine-similarity
给出一些
向量
v,我想得到另一个随机
向量
w,v
和
w之间有一些
余弦
相似
性,有没有办法
在
python
中
得到这个? 示例:为了简单起见,我将使用v3,-4
的
2D
向量
。我想得到
余弦
相似
度
为60%或+ 0.6
的
随机
向量
w。这应该生成具有值0.875、3
的
向量
w或具有相同
余弦
相似
度
浏览 48
提问于2018-10-21
得票数 2
回答已采纳
3
回答
Python:
余弦
相似
度
m*n矩阵
python
、
vector
、
numpy
、
cosine-similarity
我有两个M×N矩阵,这是我从图像中提取数据后构造
的
。这两个
向量
都有很长
的
第一行,
在
第三行之后,它们都只成为第一列。例如,原始
向量
如下所示12,4,5,5,1,2这两个
向量
都有类似的模式,前三行有很长
的
行,然后随着进程
的
进行
而变得稀疏。做
余弦
相似
度
,我
在
考虑使用填充技术来添加零,并使这两个<em
浏览 1
提问于2012-07-10
得票数 1
回答已采纳
1
回答
如何
用Lucene
和
Java计算tf-国防军
的
余弦
相似
度
java
、
lucene
、
tf-idf
、
cosine-similarity
我有一个查询
和
一组文档。我需要根据与tf-国防军
的
余弦
相似
性
对
这些文件
进行
排序。请有人告诉我,我能从Lucene那里得到什么支持来计算这个?从Lucene可以直接计算出哪些参数(可以通过lucene
中
的
某些方法直接得到tf、国防军吗?)
如何
用Lucene计算
余弦
相似
度
(如果传递查询和文档
的
两个
向量
,是否有直接返回
余弦
相似
浏览 1
提问于2012-04-16
得票数 2
2
回答
在
求
余弦
相似
性时,非额定场
的
值应该是多少?
correlation
、
recommender-system
、
cosine-distance
我正在研究一个非常基本
的
图书推荐系统。我想知道
在
找到
余弦
相似
性时,用户没有给它们打分
的
字段该
如何
处理,我们应该忽略它们,只用赋值字段计算,或者标记它们为0。我所遵循
的
书说,排除字段,因为它会给出错误
的
解释,
在
欧几里德
和
皮尔逊相关
的
情况下
,但在
余弦
相似
的
情况下
,它使所有的非额定场为0。有人能解释为什么只对于
余弦
而
浏览 0
提问于2016-06-12
得票数 8
2
回答
在对段落/doc2vec
向量
进行
聚类时,合适
的
距离度量是什么?
python
、
cluster-analysis
、
distance
、
doc2vec
、
hdbscan
我
的
目的是使用HDBSCAN
对
来自doc2vec
的
文档
向量
进行
聚类。我想找到有语义和文本重复
的
小集群。但是,要对文档
进
浏览 0
提问于2018-10-09
得票数 4
回答已采纳
2
回答
以多维
向量
形式表示
的
文档
的
高效检索
search
、
deep-learning
、
nlp
、
information-retrieval
我训练了一个基于深度神经网络
的
信息检索模型。最后,我
的
模型以128维
向量
的
形式表示文档。文档
的
语义表示类似于词
的
嵌入表示(word2vec算法)。当我
对
我
的
模型
进行
查询时,它也将查询表示
在
相同
的
128维
向量
空间中。现在,从整个
向量
空间中,我想检索最接近在同一个
向量
空间中表示
的
查询
向量
的
顶部k个
浏览 9
提问于2020-04-21
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
相似性与相关性度量
NLP中的嵌入和距离度量
深度学习第45讲:GloVe词向量与相关应用
RUBER:一种无监督对话系统回复质量的评价方法
使用深度学习的方法进行人脸解锁
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券