腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
当在Scikit的光谱
聚
类
中
使用
预先计算的亲和力
矩阵
时,KNN?
python
、
machine-learning
、
scikit-learn
、
cluster-analysis
、
unsupervised-learning
我有一个
相似
度
矩阵
,我计算了大量对象之间的
相似
度
,每个对象可以与任何其他对象具有非零的
相似
度
。我为另一个任务生成了这个
矩阵
,现在想对其
进行
聚
类
以
进行
新的分析。看起来方法可能是一个很好的选择,因为我可以传入一个预先计算的亲和
度
矩阵
。我还知道,在构建亲和
度
矩阵
时,谱
聚
类
通常会<e
浏览 1
提问于2016-10-20
得票数 0
0
回答
如何
使用
相似
度
矩阵
和
包含
索引
进行
聚
类
?
python
、
indexing
、
scikit-learn
、
dbscan
、
distance-matrix
我有一个像这样的熊猫数据帧,其中每个ID都是一个带有变量attr1、attr2
和
attr3的观察值: 202 3 21 3 1 3 并制作了一个我想
使用
的
相似
度
矩阵
,其中ID是基于成对属性差异的总和
进行
比较的。我尝试
使用
sklearn中的DBSCA
浏览 4
提问于2017-06-09
得票数 1
回答已采纳
1
回答
如何
根据
相似
度
矩阵
对大量字符串
进行
聚
类
?
python
、
cluster-analysis
我需要根据500K+字符串的
相似
性对其
进行
聚
类
。 我已经计算了它们成对的Levenshtein距离,并制作了一个稀疏
相似
矩阵
。此
矩阵
包含
二进制
相似
性:较小距离的值设置为1.0,其他距离的值为0.0。 我不知道什么样的集群对我有好处。我事先不知道
聚
类
的数量,但它可能相当大,因为
相似
度
矩阵
非常稀疏(大约0.1%的值是非零的)。
浏览 38
提问于2021-01-14
得票数 0
回答已采纳
1
回答
相似
度
矩阵
的
聚
类
技术
cluster-analysis
、
hierarchical-clustering
、
clustering-key
我在这些二进制数据上尝试了一些
聚
类
算法,比如模糊
聚
类
和
层次
聚
类
,但它没有给我任何好的结果,而且创建的
聚
类
真的很糟糕。因此,现在我已经将骰子系数
相似
度
矩阵
应用于数据w.r.t响应者,这基本上给出了每个响应者与所有其他响应者的
相似
度
得分。是否有可能在这个
相似
度
矩阵
上应用
聚
浏览 5
提问于2017-03-07
得票数 0
3
回答
基于距离
矩阵
的词
聚
类
python
、
cluster-computing
、
scikit-learn
、
hierarchical-clustering
我的目标是根据单词与文本文档语料库的
相似
度
对单词
进行
聚
类
。我已经计算了每对单词之间的Jaccard
相似
度
。换句话说,我有一个可用的稀疏距离
矩阵
。有没有人能给我介绍一些以距离
矩阵
作为输入的
聚
类
算法(可能还有它的Python库)?我事先也不知道集群的数量。我只想对这些单词
进行
聚
类
,并获得哪些单词聚在一起。
浏览 0
提问于2013-04-27
得票数 24
1
回答
在通过networkx生成的图上
使用
scikit学习
进行
谱
聚
类
cluster-analysis
、
scikit-learn
、
partitioning
、
networkx
、
spectral
我有一个3000x50特征向量
矩阵
。我
使用
sklearn.metrics.pairwise_distances获得了一个
相似
度
矩阵
,名为' similarity _ matrix‘。现在,我
使用
上一步生成的
相似
度
矩阵
G=nx.from_numpy_matrix(Similarity_Matrix),
使用
networkx创建了一个图。我现在想在这个图G上执行光谱
聚
类
,但几次
浏览 13
提问于2014-05-16
得票数 5
1
回答
什么是光谱
聚
类
?
clustering
什么是光谱
聚
类
?我几乎没有统计学的背景。我试着在网上搜索笔记,但他们假设了很多知识。 如果你能在网上找到一些关于光谱
聚
类
的基础知识和数学基础的笔记,那就更好了。
浏览 0
提问于2018-06-21
得票数 4
1
回答
相似
度
矩阵
聚
类
python
、
cluster-analysis
、
data-analysis
我尝试对文本数据
进行
聚
类
,数据清晰,标记化等。我
如何
在Kmeans或其他
聚
类
模型中输入
相似
度
矩阵
?
浏览 3
提问于2020-09-01
得票数 0
1
回答
聚
类
中的
相似
矩阵
data-mining
、
clustering
、
similarity
我正在编写一种
聚
类
算法,这在这中得到了解释。根据本文提出的算法,该算法通过结构
相似
度
和
属性
相似
度
进行
聚
类
。 在
使用
属性
相似
性
进行
聚
类
时,我有问题。我认为,首先用结构
相似
性
聚
类
,然后在顶点之间用属性
相似
度
划分
聚
类</
浏览 0
提问于2016-12-08
得票数 -4
1
回答
当我
使用
余弦
相似
度
时,为什么我得到的邓恩指数是负值?
matlab
、
cluster-analysis
、
distance
、
cosine-similarity
我
使用
k-means对归一化数据
进行
聚
类
。我
使用
了不同的
相似
度
矩阵
,如欧几里得、曼哈顿
和
余弦,当我
使用
余弦
相似
度
时,Dunn指数为负值。我读到过邓恩指数的取值范围从0到无穷大。
使用
余弦
相似
度
计算Dunn指数是正确的吗? 我用过this implementation of Dunn Index。
浏览 94
提问于2019-06-12
得票数 1
回答已采纳
2
回答
从
相似
矩阵
执行
聚
类
python
、
clustering
、
k-means
我计算了每个向量之间的
相似
度
分数,并将其存储在一个
相似
矩阵
中。我想根据这个
相似
矩阵
对歌曲
进行
聚
类
,以尝试识别集群或某种类型的歌曲。我
使用
networkx包从
相似
矩阵
中创建了一个力有向图,
使用
了弹簧布局。然后,我将KMeans
聚
类
用于该图中节点的位置,这就产生了有意义的集群。我也尝试在
相似
矩阵
上
浏览 0
提问于2021-04-15
得票数 1
3
回答
python中的单词
聚
类
列表
python
、
nlp
、
cluster-analysis
、
text-mining
假设我有一个单词列表'car','dog','puppy','vehicle',我想把单词
聚
成k组,我希望输出是['car','vehicle','dog','puppy']。我首先计算每个成对单词的
相似
度
得分,得到一个4x4
矩阵
(在本例中) M,其中Mij是单词i
和
j的
相似
度
得分。在将单词转换为数字数据后,我利
浏览 19
提问于2017-01-31
得票数 5
1
回答
在mahout谱
聚
类
中,亲和力
矩阵
中的对角元素值应该是多少
java
、
hadoop
、
mapreduce
、
data-mining
、
mahout
正如标题所述,下面是指向频谱
聚
类
的链接附言:我有自己的方法来计算
相似
度
分数,所以我不想<e
浏览 0
提问于2014-09-06
得票数 0
1
回答
sklearn
如何
计算谱
聚
类
的最近邻亲和
度
矩阵
?
scikit-learn
、
nearest-neighbor
很简单,如果我将最近邻居的数量指定为k,那么对于每个节点,它都会找到最近的k个节点,并将亲和
度
指定为1。 然而,我观察到由sklearn谱
聚
类
最近邻生成的亲和力
矩阵
并不只
包含
0
和
1。
浏览 28
提问于2017-07-14
得票数 0
回答已采纳
1
回答
基于亲合传播的
聚
类
doc2vec
scikit-learn
、
clustering
、
word2vec
、
gensim
、
tsne
我希望
使用
关联传播对文档向量(doc2vec)
进行
聚
类
。
使用
余弦
相似
性来
聚
类
我的doc2vec文档向量正确吗? 此外,我希望
使用
to可视化我的集群结
浏览 0
提问于2018-01-04
得票数 1
1
回答
scikit通过预计算学习谱
聚
类
亲和力
python
、
scikit-learn
、
cluster-analysis
我有一个
相似
度
矩阵
,它考虑了80个用户中每两个用户之间的
相似
度
。我想根据这个
相似
度
矩阵
对用户
进行
聚
类
。label = SpectralClustering(n_clusters=5 ,affinity='precomputed').fit_predict(lena) 这是调用
相似
度
矩阵
并获得标签的正确方法吗例如:如果我们有三个
浏览 5
提问于2015-12-10
得票数 0
1
回答
如何
将文本
和
分类数据混合在一起的数据
进行
聚
类
?
clustering
、
text-mining
、
k-means
、
categorical-data
但是,分类信息并不总是很好,所以我需要根据文本内容
和
类别对消息
进行
聚
类
。做这件事最好的方法是什么?
浏览 0
提问于2015-05-18
得票数 3
3
回答
用Kmeans
聚
类
词
python
、
nlp
、
nltk
、
k-means
如何
使用
Kmeans来
聚
类
术语(1-2个单词)。我读了一篇研究论文,他们用K方法用Levenshtein距离来
聚
类
相似
的术语。请给我看一个示例代码。谢谢 注:在研究论文中,他们
使用
Levenshtein距离计算了
相似
度
矩阵
,并将其用于
聚
类
。
浏览 1
提问于2019-06-15
得票数 0
回答已采纳
1
回答
如何
使用
K-medoid算法根据不确定数据的概率分布
相似
性对其
进行
聚
类
?
cluster-analysis
什么是不确定数据
聚
类
?
如何
根据不确定数据的概率分布
相似
度
对其
进行
聚
类
?
如何
根据不确定数据的概率分布
相似
度
使用
K-medoid算法对不确定数据
进行
聚
类
?
浏览 0
提问于2013-09-27
得票数 0
1
回答
文档间n*n
相似
度
的doc2vec
聚
类
cluster-analysis
、
gensim
、
doc2vec
我有一组
使用
gensim doc2vec生成的文档向量(大约500K个150维的向量)。我希望对想要生成n*n
相似
度
矩阵
的
相似
文档
进行
聚
类
,我可以在该
矩阵
上运行我的
聚
类
算法。我
使用
gensim.similarities尝试了这个链接的指令,但是500k记录的输出是500k*150
矩阵
。我不明白输出结果。它不应该是500k * 500k吗?我是不是遗漏了什么?
浏览 0
提问于2017-11-08
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券