腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
在
ElasticSearch
中有
没有
一种
算法
可以
给出
向量
之间
的
相似
度
?
、
、
、
、
在
我开始之前,我真的不知道Elastic是什么以及它是如何工作
的
。我是ML工程师,最近被分配了Image - Image similarity
的
任务。我开发了一个模型,它将为每个图像提供一个
向量
,然后我必须比较该模型(如Manhattan, Euclidean, cosine etc )提供
的
向量
之间
的
距离。我
可以
很容易地做到这一点,但问题是,我有大约200M图像
的
巨大数据,我不能将所有的
向量
存储在
浏览 27
提问于2020-12-30
得票数 0
2
回答
利用Bhattacharyya距离进行特征选择
、
、
、
我有一套240
的
特征提取使用图像处理。目的是
在
训练后将测试用例划分为7个不同
的
类。对于每个类,大约有60个观测值(即,对于每个类,我有大约60个特征
向量
,每个
向量
都有240个组件)。许多研究论文和书籍利用序列前向搜索或顺序反向搜索从特征
向量
中选择最佳特征。下面的图片
给出
了
一种
顺序前向搜索
算法
。 任何这样
的
算法
都使用某种标准来区分特征。
一种
常用
的
方法是使用Bh
浏览 1
提问于2013-10-26
得票数 6
回答已采纳
1
回答
是否标准化word
向量
和文档
向量
之间
的
相似
性?
、
、
、
、
余弦
相似
度
被广泛用于度量两个
向量
之间
的
相似
性,其中两个
向量
可以
是单词
向量
或文档
向量
。 其他
的
,如曼哈顿、欧几里得、明可夫斯基等,也很受欢迎。余弦
相似
度
给出
了介于0和1
之间
的
数字,因此它似乎是两个
向量
之间
相似
度
的
百分比。欧几
浏览 2
提问于2018-05-15
得票数 0
3
回答
Elasticsearch
评分
、
我使用
elasticsearch
通过"more like this“查询查找与给定文档
相似
的文档。谢谢!
浏览 1
提问于2014-07-30
得票数 1
1
回答
设计
相似
度
表
、
、
、
所以从上面的表格..图书1和图书2
的
相似
性指数为0.92。来自n+1
的
数据是实时
的
。所以我要做
的
第一步是填充这一新行..
一种
非常幼稚
的
方法是这样
的
。i = 0; i < total_books ; i++假设计算任何书籍
相似
度
的
计算都非常快。但
浏览 2
提问于2012-04-15
得票数 1
1
回答
两个文档
之间
的
不同特征
、
、
、
我试图找出这两份文件
之间
的
不同之处。我正在使用gensim,到目前为止已经获得了
相似
度
分数。 有
没有
办法知道两个文档
之间
的
相异分数和相异特征?如何评估它?
浏览 1
提问于2018-07-03
得票数 0
1
回答
查找两个文档
之间
的
相似
度
、
lucene
中有
没有
内置
的
算法
来查找两个文档
之间
的
相似
度
?当我通过默认
的
相似
性类时,它会在比较查询和文档后
给出
分数作为结果。我已经为我
的
文档建立了索引,使用了snowball分析器,下一步将是找到两个文档
之间
的
相似
性。 有人能
给出
一个解决方案吗?
浏览 2
提问于2012-01-13
得票数 1
1
回答
基于字典
的
字符串匹配
算法
-- Java
、
、
Java
中有
没有
基于字典
的
字符串匹配
算法
?对于它,实现如下所示:会
给出
很高
的
比例吗
浏览 2
提问于2013-01-13
得票数 0
回答已采纳
2
回答
可以
用来匹配句子
的
算法
是什么?
、
、
假设我们有一个包含50个句子
的
列表,我们有一个输入句子。如何从列表中选择与输入句子最接近
的
句子?我尝试了许多方法/
算法
,例如对句子中每个标记
的
word2vec
向量
表示进行平均,然后对结果
向量
进行余弦
相似
度
计算。 例如,我希望
算法
在
“书
的
定义是什么?”
之间
给出
一个很高
的
相似
性分数。我正在寻找
一种
方法(可
浏览 2
提问于2016-12-22
得票数 0
1
回答
余弦
相似
-缺点作为推荐引擎?
、
、
、
、
我见过
在
K-最近邻
算法
中使用余弦
相似
性来生成基于用户偏好
的
推荐。在这些模型中,将给定产品
的
用户等级作为
向量
,然后由两个
向量
之间
的
余弦
相似
度
来确定两个用户
之间
的
相似
度
。(例如) 我
的
问题是:能解释使用Cosine
相似
性
的
推荐引擎是如何计算出并行用户偏好
的
吗?在
浏览 2
提问于2014-10-07
得票数 1
回答已采纳
2
回答
相似
矩阵->特征
向量
算法
?
、
、
、
、
如果我们有一组M词,并且预先知道每一对单词
的
意思
的
相似
性(有一个M
相似
矩阵),那么我们
可以
使用哪
一种
算法
为每个单词生成一个k维位
向量
,这样就
可以
通过比较每一对单词
的
向量
来比较它们
的
意思(例如,得到
向量
的
绝对差如果我知道的话,
在
一堆具有类似描述
的
算法
中找到它会容易得多,这些
算法
浏览 12
提问于2011-10-12
得票数 6
回答已采纳
2
回答
创建给定余弦
相似
度
的
随机
向量
、
、
给出
一些
向量
v,我想得到另一个随机
向量
w,v和w
之间
有一些余弦
相似
性,有
没有
办法
在
python中得到这个? 示例:为了简单起见,我将使用v3,-4
的
2D
向量
。我想得到余弦
相似
度
为60%或+ 0.6
的
随机
向量
w。这应该生成具有值0.875、3
的
向量
w或具有相同余弦
相似
度
的
任何其
浏览 48
提问于2018-10-21
得票数 2
回答已采纳
1
回答
聚类中
的
相似
矩阵
、
、
我正在编写
一种
聚类
算法
,这在这中得到了解释。根据本文提出
的
算法
,该
算法
通过结构
相似
度
和属性
相似
度
进行聚类。
在
使用属性
相似
性进行聚类时,我有问题。我认为,首先用结构
相似
性聚类,然后
在
顶点
之间
用属性
相似
度
划分聚类。但是,我不知道如何找到集群中顶点
之间
的
属性
相似
浏览 0
提问于2016-12-08
得票数 -4
4
回答
在
语义
相似
性方面,是否有比较字符串
的
好
的
NLP?
、
、
、
、
我用MySQL创建了一个小型数据库,其中存储了一些有关流量
的
数据,并根据用户与聊天机器人
的
交互情况,
在
适当
的
时候使用PHP脚本获取这些数据。我想知道当用户询问同一个问题
的
变化时,如何处理这个问题,因此
可以
用相同
的
答案来回答。例如:高街交通
的
原因是什么?我
在
大街上堵车了。显然,我
可以
从删除停止词(例如did)、命名实体(例如,公路->大街)
浏览 0
提问于2018-04-19
得票数 4
1
回答
最近邻
算法
中距离度量
的
替代方案?
、
、
、
、
我遇到了最近邻居
算法
的
一个实现,用于
在
两个
相似
图像中
的
某些关键点
之间
查找匹配。关键点由SIFT
算法
生成。这些点由128维
向量
描述,并且
在
两个图像中都有许多这样
的
点。匹配
算法
使用最近邻搜索,并且对于一幅图像中
的
每个点,计算另一幅图像中相应
的
最近点。“贴近
度
”由点
向量
之间
的
最小欧几里德距离来描述。
浏览 2
提问于2010-06-30
得票数 3
回答已采纳
1
回答
向量
索引
的
余弦
相似
度
及其加权
、
、
、
我对NLP非常陌生,虽然这似乎是一个基本
的
问题,但我不知道如何在网上搜索答案。📷我需要使用什么方法来提取关键字级别
之间
的
相似
性?我想找出两个文本是如何
相似
的基础上,它包含了哪些关键字和这些关键字
的
排名。我尝试了余弦
相似
浏览 0
提问于2020-12-12
得票数 2
1
回答
Elasticsearch
中索引
的
新方法
我想在
Elasticsearch
中定义
一种
新
的
索引方法,因此我将编辑tf idf方法。哪里
可以
找到TF-IDF
elasticsearch
的
实现?为了实现新方法,我需要操作
elasticsearch
源代码中
的
哪些包?
浏览 1
提问于2017-04-19
得票数 0
1
回答
一组文本文档
的
相似
性
、
、
我正在寻找
一种
算法
,试图检查2)多个文档(约5000个)
之间
的
相似
度
我需要相同
的
,因为我正在尝试评估特定类别下
的
文本文档/句子是否以任何方式彼此
相似
。有
没有
什么现有的方法
可以
做到这一点。
浏览 2
提问于2017-05-16
得票数 0
3
回答
如何在社交媒体数据集中发现主题?
、
、
、
我正在做一个项目,我需要发现社交媒体数据集中存在
的
主题。例如,我想提取200K推特上存在
的
主题。有人向我推荐机器学习
算法
吗?
浏览 0
提问于2016-06-16
得票数 4
4
回答
预留内存空间
的
最佳方法是什么?
、
、
起初,我为我糟糕
的
语法感到抱歉。例如,我认为最初有5000个集群会导致程序内存崩溃,那么有什么想法
可以
用另
一种
方式来存储这个矩阵吗?也许
在</em
浏览 0
提问于2009-12-04
得票数 2
点击加载更多
相关
资讯
学习搜索必须先了解的Lucene知识
Python 谱聚类算法从零开始
机器学习基础:相似度和距离度量究竟是什么
基于ALBERT的文本相似度解决方案
相似性与相关性度量
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券