腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
一组
非线性
数据
的
相似性
比较
和
量化
、
我有两个
数据
列表,它们基本上是来自一个更大
的
数据
库
的
一批顺序
数据
(因此,
数据
不能排序),如下所示 a = [0.8, 0.9, 0.4, -0.4, 1.12, 1.16, 1.08, 1.22] b= [0.85, 0.96, 0.4, -0.4, 1.15, 1.18, 1.1, 1.92] 所提供
的
数据
在本质上可能不是线性
的
,因此典型
的
相关性不会达到目的。我希望将a
和
b(作为折线图)进行<em
浏览 33
提问于2021-07-01
得票数 0
3
回答
什么是特征向量
比较
的
好度量?如何在
比较
之前对它们进行规范化?
、
、
为了
量化
一个区域
的
外观,我使用了几种度量--强度统计,纹理特征等等。我将计算出
的
区域
的
所有特征合并成一个长
的
特征向量。问题:- F1
和
F2之间
的
相似性
有什么好
的
度量标准? -在用度量
量化
F1
和
F2
的
相似
浏览 4
提问于2013-06-20
得票数 7
1
回答
使用scipy
的
各种稀疏矩阵乘积
的
性能
、
、
、
我有一个术语文档矩阵作为稀疏矩阵( csr或coo矩阵),还有一个要进行
相似性
比较
的
特征向量。2.)将doc矩阵作为csr矩阵,将其转换为ndarray,然后矩阵将该矩阵与向量相乘,并除以幅度
和
反余弦,以获得相似分数虽然fisrt方法利用了快速向
量化
和</e
浏览 2
提问于2018-12-10
得票数 1
2
回答
如何根据
数据
集中两个特征
的
分布对它们
的
相关性进行排序?
、
、
假设我们得到了一个
数据
集,并希望根据分布
的
相似性
对它们进行排序。我不想用视觉化。有什么足够
的
方法和我分享吗?我有一个想法,比如,我们可以从特征中减去一些百分位数,然后找出它
的
平均值。
浏览 0
提问于2023-05-27
得票数 0
2
回答
线性
量化
和
非线性
量化
的
区别是什么?
、
、
、
线性
量化
和
非线性
量化
的
区别是什么?我说
的
是关于PCM
的
样品。有一篇关于它
的
文章,但我正在寻找一个更详细
的
答案。
浏览 2
提问于2011-03-16
得票数 5
3
回答
给定
一组
点或矢量,找到彼此最接近
的
N个点
的
集合
、
、
例如,我有100个向量,每个向量
的
维数是12,我想找出8个彼此最接近
的
向量。换句话说,前8个匹配向量。我可以使用欧几里得或曼哈顿距离作为度量标准来
量化
向量之间
的
相似性
。初步
的
想法表明,我可以将这个问题描述为一个0-1
非线性
规划,随着向量数量
的
增加,这个问题是NP难以求解
的
。我还使用了k-means聚类算法,但它不使用欧几里德距离作为度量。我问这个问题
的
原因是因为我确信这个问题在文献中已经解决了,但是我找不到这样<em
浏览 42
提问于2020-10-27
得票数 1
4
回答
用于度量
相似性
的
FFT图像
、
、
、
好
的
,我正在写一个小
的
Java应用程序,它接受两个图像作为输入,
比较
它们,然后给出一个
量化
的
输出作为
相似性
的
度量(例如。50%相似)。到目前为止,我已经实现了另一个函数,它基本上给了我两个直方图(每个图像一个)。我现在所需要
的
就是编写一个方法,它将对图像进行快速傅立叶变
浏览 0
提问于2011-04-04
得票数 1
1
回答
字向量基准
、
、
向量空间字表示对于许多自然语言处理应用程序非常有用,因为它们有助于
量化
两个单词在语义上
的
相似性
。我使用word2vec在不同
的
数据
集上训练了几个单词
的
向量表示。我正在寻找一个程序,可以:与其他向量表示进行
比较
(如果可能的话,尽可能接近最先进
的
水平)。
浏览 0
提问于2014-06-11
得票数 0
回答已采纳
3
回答
为什么只支持向量机中
的
超平面?
、
、
据我所理解,超平面被用来将
数据
(提升到更高维度)分离成两个相互排斥
的
部分(分区)。我
的
问题是为什么它应该是一个超平面而不是一个具有曲率
的
曲面?这不是提供了一个更适合
的
分离‘表面’吗?
浏览 0
提问于2014-06-17
得票数 2
回答已采纳
1
回答
使用Python将唯一单词
的
LIst矢
量化
为0或1
、
、
、
我是Python
的
新手,最近不得不做一些文本处理来做两个文本之间
的
余弦
相似性
。我在这里尝试过搜索
和
查看堆栈溢出,但似乎常见
的
解决方案之一是在转换列表时使用例如,有一个文本文件(在将其全部矢
量化
为1之后),我想要计算与此字典<em
浏览 1
提问于2015-01-22
得票数 1
回答已采纳
1
回答
比较
Python中
的
排名列表
、
、
对于每个产品,我想使用
相似性
度量来识别以下四个相关产品。 我想
比较
由我
的
模型(预测)生成
的
排名列表
和
领域专家指定
的
排名列表(基本事实)。通过阅读,我发现我可能会使用基于等级相关
的
方法,例如Kendall头/先锋来
比较
排名列表。但是,我不确定这些方法是否合适,因为我
的
样本数量很少(4)。如果我错了,请纠正我。另一种方法是使用Jaccard
相似
浏览 1
提问于2016-11-25
得票数 2
2
回答
如何根据Python中
的
相似性
或重叠
比较
两个集群分组?
、
、
、
、
我想要做
的
事情
的
简单例子: 假设我有3个
数据
点A、B
和
C。我对这些
数据
运行KMeans集群,并得到2个集群[(A,B),(C)]。然后对这些
数据
运行MeanShift集群,得到2个集群[(A),(B,C)]。很明显,这两种聚类方法对
数据
进行了不同
的
聚类。我希望能够
量化
这种差异。换句话说,我可以使用什么度量来确定从这两个算法中获得
的
两个集群组之间
的
百分比
相似性
/重叠?以下是
浏览 3
提问于2017-07-13
得票数 6
回答已采纳
1
回答
mahout中余弦相似度
的
计算
、
、
为了找出两个文档之间
的
相似性
,我计划采用mahout来完成这项任务。将文档转换为tf-移除停止词(使搜索有效)运行余弦相似度给出了相似度 我正计划在mahout中实现这一点。告诉我,这是否是计算文档间
相似性
的
有效方法?
浏览 2
提问于2012-01-05
得票数 1
回答已采纳
1
回答
点集相似度度量
我正在寻找一些快速度量来度量两组点之间
的
相似性
,如质心距离、重叠量等。 理想情况下,我希望采取更多
的
度量来提高基本
相似性
度量
的
准确性,但关键
的
特性是它们在理想情况下需要快速
和
可伸缩。
浏览 0
提问于2011-02-15
得票数 3
1
回答
我能用一袋单词来寻找向量之间
的
余弦
相似性
吗?
、
、
我有一个像这样
的
单词
数据
集:abc 1 0 0 1xyz 0 1 0 0最后
的
目的是
比较
我
的
原始
数据
和
潜在
数据
的
余弦<em
浏览 2
提问于2021-06-10
得票数 0
1
回答
如何计算集群
的
一致性/质量?
、
、
、
、
我想计算每个组内
的
相似之处,以检查里面的句子是否很好地聚在一起。我想保持句子在每
一组
中都有很好
的
相似性
。如果
相似性
不好,我想退出不属于集群
的
句子,下
一组
不属于聚类
的
相似句子。 我怎样才能做得好呢?我想使用余弦相似,但不知道如何
比较
一个簇内
的
所有句子
浏览 3
提问于2022-04-05
得票数 2
1
回答
R中具有图核
的
图聚类
、
、
我有
一组
大小不同
的
9张有向图,我想使用图聚类来创建一个树状图,说明它们
的
结构
相似性
,类似于在NetConfer网络
比较
工具中所做
的
工作。(我不只是使用这个工具
的
原因是,目前它只能处理8个图形,我希望能够使用其他技术来确定图
的
相似性
,而不是它所使用
的
“边缘-Jaccard”方法,而且我希望能够在R中为可再现性而这样做)。据我所读,图核似乎是一种公认
的
量化
图之间
相似性
浏览 1
提问于2020-06-24
得票数 0
1
回答
帮助选择算法计算两个文本之间
的
差异?
、
我
的
任务是创建一个工具,它将能够找到文章--给定参考文章
的
副本。我知道词向
量化
(tf,word2vec),RNN方法,但我不能选择适合我
的
情况
的
东西。我
的
要求:有一个参考文本,其副本需要找到。 复制可以是复制
的
,也可以是部分复制
的
(按段落),也可以是被转述
的
。参考-
浏览 0
提问于2019-02-19
得票数 1
回答已采纳
1
回答
计算二进制pandas
数据
帧
的
相似性
度量
、
、
、
、
我需要在python中编码一个
相似性
分数,以便根据电影类型找到匹配
的
内容。 该
比较
是为了让1个用户找到他们
的
二进制类型评分与40,000个电影标题
的
二进制类型评分
数据
帧之间
的
相似性
。我需要遍历
数据
帧,并将每个项目与用户得分进行
比较
,以找到相似度。以用户1为例: 0,1,0,0,0,0,1,0,0,0,1,1,0,0,0,1
比较
与电影
数据
帧
的
相似性</em
浏览 39
提问于2020-10-23
得票数 0
1
回答
消除原型网络余弦相似度
的
约简
、
、
、
、
我在tensorflow中实现了一个原型网络,它使用余弦
相似性
来
比较
模型
的
输出
和
之前计算
的
原型。这很好,但问题是它非常慢。之所以速度慢,是因为我必须用每个单独
的
原型分别计算每一个输出
的
余弦相似度。这将防止在GPU上对其进行潜在
的
并行化。在tensorflow中,您可以获得批处理
和
一组
标签之间
的
余弦
相似性
,但是它将损失降低到一个值。这并不适用于我想要
的
,因为我需要找
浏览 5
提问于2022-03-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券