具有相似模式的聚类向量_基于相似度的项目聚类_具有不均匀聚类的聚类(k-means) - 腾讯云开发者社区

clustering

提供一套(m no.关于n维向量，正确的无监督的聚类方法是什么？向量本质上代表了模式。问题是:是否存在一组向

浏览 0提问于2019-06-18得票数 1

1回答

具有相似模式的聚类向量

python、cluster-analysis

假设我有很多向量，其中一些是： a: [1,2,3,4,3,2,1,0,0,0,0,0]c: [1,2,3,2,1,0,0,0,0,0,0,0] 我们可以在向量a和c之间看到类似的模式。我的问题是，是否可以将这两个分类到同一个集群，并将b分类到另一个集群。我不喜欢使用像KMeans这样的算法，因为值并不有趣，只有模式才有趣。欢迎任何建议，尤其是Phyton中的解决方案。谢谢

浏览 17提问于2020-06-08得票数 0

1回答

聚类算法

machine-learning、data-mining、clustering

我有稀疏向量，并且发现余弦相似度是度量相似度的有效方法。现在我想根据相似性对这些向量进行聚类。因此，有人能建议/推荐使用余弦相似性的聚类算法吗？ P.S.：我没有预先定义好的簇数，而是希望聚类算法自己来决定它。

浏览 0提问于2017-07-03得票数 0

回答已采纳

1回答

基于亲合传播的聚类doc2vec

scikit-learn、clustering、word2vec、gensim、tsne

我希望使用关联传播对文档向量(doc2vec)进行聚类。使用余弦相似性来聚类我的doc2vec文档向量正确吗？此外，我希望使用t

浏览 0提问于2018-01-04得票数 1

2回答

聚类一长串单词

string、cluster-analysis、k-means、levenshtein-distance、pattern-recognition

我手头有以下问题:我有一个很长的单词列表，可能是名字、姓氏等等。我需要对这个单词列表进行聚类，以便类似的单词，例如具有相似编辑(Levenshtein)距离的单词出现在同一组中。例如，“算法”和"alogrithm“应该有很高的机会出现在同一个集群中。在模式识别的文献中，我对经典的无监督聚类方法如k均值聚类、EM聚类

浏览 3提问于2014-11-07得票数 2

回答已采纳

1回答

如何将给定样本聚类到谱聚类算法计算的类中心？

machine-learning、cluster-analysis、spectral

假设我们根据谱聚类算法得到几个具有训练样本的中心{C1(d1，d2...dn)，C2...}。如果一个新的测试样本向量(x1，...xn)，我应该怎么做才能把它放到一个类中？请注意，我们在谱聚类过程中使用的相似性矩阵不仅基于训练向量之间的欧几里德距离，还基于测地距离。因此，距离不能仅用两个向量来计算，并且类中心也不像我们在K-m

浏览 3提问于2011-01-05得票数 2

2回答

从相似矩阵执行聚类

python、clustering、k-means

我有一个歌曲列表，我为每个歌曲提取了一个特征向量。我计算了每个向量之间的相似度分数，并将其存储在一个相似矩阵中。我想根据这个相似矩阵对歌曲进行聚类，以尝试识别集群或某种类型的歌曲。我使用networkx包从相似矩阵中创建了一个力有向图，使用了弹簧布局。然后，我将KMeans聚类用于该图中节点的位置，这就产生了有意义的集群。但是，我不确定这是否是正

浏览 0提问于2021-04-15得票数 1

1回答

对1000幅图像进行聚类，以找到具有更大相似性的图像组

image、image-processing、cluster-analysis

我有1000张2D灰度图像，并希望在python中对它们进行聚类，使具有更多相似之处的图像保持在同一组中。图像表示简单的几何形状，包括圆、三角形等。如果我把每幅图像都压平成一个向量，然后运行聚类算法，那就非常复杂了。图像是400*500，所以我的聚类训练数据将是1000*200000，这意味着200000功能！

浏览 7提问于2016-03-10得票数 2

回答已采纳

1回答

Weka，如何使用聚类方法对相似字符串模式进行分组

string、attributes、cluster-analysis、weka

我正在使用Weka的聚类方法对相似的字符串模式进行分组。我首先使用了weka的stringtowordVector函数，然后直接使用了一些聚类方法，但是我得不到正确的结果，有人能给我一些正确的方法来对这类数据进行分组吗？acehiadfhjacehiadfhjadfhjadfhjadfhjacfhjadfhjadfhjadfhjadfhjadfhjacehj acehiadfhjacehiadfhjadfhjacfh

浏览 1提问于2017-07-17得票数 0

1回答

将表(具有类似模式)聚在一起

machine-learning、nlp、clustering

ID, FirstName, LastName, City, Address, CardID我想对表示类似实体的文件当前的方法:我尝试了一个相似评分b/w两个表，这是基于重叠列b/w，两个表和相似b/w的表名。table name similarity is computed by computing the dice coeff. of the two tables names

浏览 0提问于2022-01-31得票数 0

1回答

长度归一化的应用是什么？

nlp、normalization

我找到了一些关于的信息。我发现它只在搜索引擎的上下文中提到。人们是否为了不同的文字目的而使用它？(请原谅我的无知。我确实搜索过它的其他用途，但是google一直把“正常化”和“缩放”混淆在一起。

浏览 2提问于2014-01-29得票数 1

回答已采纳

2回答

什么是主题建模以外的？

nlp、topic-model、lda

我现在很好奇，是否还有其他方法可以在相同或相似的上下文中对文档进行无监督的聚类？ (旁白)是否有任何方法显示一个或多个主题的相似之处？

浏览 0提问于2018-08-05得票数 2

回答已采纳

1回答

基于多词相似度的聚类

machine-learning、nlp、cluster-analysis、word-embedding

我正在尝试实现对银行事务数据的群集。数据集包含关于Vendor和MCC的列，它们是string。这些列中有太多不同的值，我想根据一些指标(如cosine similarity for Vendor or MCC )进行集群。(例如，'Hotel A'和'Hotel B'可以在同一个集群中。)我认为Levenshtein distance是不够的。我考虑为MCC找到一个语料库，并建立一个模型来查找单词之间的相似性。这个方法对这个问题有好处吗？如果没

浏览 4提问于2020-08-08得票数 0

1回答

一种面向FastText的聚类方法

cluster-analysis、fasttext

我正在使用预先训练好的fastText ()向量对短聊天消息执行聚类。这意味着结果向量将是组成消息的令牌的平均值。在这种情况下，如何选择正确的聚类方法？

浏览 0提问于2018-08-22得票数 2

4回答

聚类相似性度量

machine-learning、clustering、similarity

我正在处理一个聚类问题。我无法为我的系统找到正确的相似性度量。我有n个具有有序向量的节点(例如：1，0，1，0 "1“表示ith对象的存在，"0”表示对象的缺失)。我想把他们聚在一起。

浏览 0提问于2018-02-20得票数 0

1回答

基于pearson相关的聚类

cluster-analysis、data-mining、k-means、hierarchical-clustering、dbscan

我有一个用例，在这里，我每15分钟有一个月的流量数据。这些数据是为网络中的各种资源收集的。我的问题是，我应该采用哪种方法来对类似的资源进行聚类？现有的K均值聚类方法都是基于欧氏距离

浏览 6提问于2015-06-11得票数 1

回答已采纳

3回答

基于最相似项目列表的聚类算法？

machine-learning、data-mining、clustering、dataset

我是机器学习的初学者。我有一个大型的项数据集，每个数据集中都有有限的一组最相似的项，我希望创建集群，最好是每个集群都具有相同的大小，尽管这是不必要的。有人能给我指明正确的方向吗？谢谢。

浏览 0提问于2018-04-21得票数 2

1回答

雪花中的自动聚类是如何工作的？

snowflake-cloud-data-platform

雪花中的自动聚类看起来非常不可预测。上周，我在三个表上创建了一个集群密钥。所有这些表在性质上都是相似的，具有相似的摄入模式。群集键也位于同一两列上。我注意到的是，对于其中一个表，集群比其他两个表的触发频率更高。这个特定的表是其他两个表中最小的。同样，这三个表的摄入模式也是相同的。我想知道聚类算法是如何工作<e

浏览 1提问于2020-07-24得票数 0

回答已采纳

1回答

如何从其他文本中找到某些词的同义词

algorithm、machine-learning、nlp

我想知道怎样才能从很多文本中找到有类似意思的词，比如新闻文章。

浏览 2提问于2020-03-21得票数 0

回答已采纳

3回答

K-表示具有CSV的聚类(相似性，doc_id1，doc_id2)？

python、csv、cluster-analysis、tf-idf、cosine-similarity

我有一个具有以下数据集的CSV：1 | 34 | 00.966014701 | 35 | 16其中，“相似性”指的是来自tf-国防军余弦相似度计算的值，而doc_ids指的是文档。因此，相似

浏览 0提问于2017-08-16得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

聚类一组向量

具有相似模式的聚类向量

聚类算法

基于亲合传播的聚类doc2vec

聚类一长串单词

如何将给定样本聚类到谱聚类算法计算的类中心？

从相似矩阵执行聚类

对1000幅图像进行聚类，以找到具有更大相似性的图像组

Weka，如何使用聚类方法对相似字符串模式进行分组

将表(具有类似模式)聚在一起

长度归一化的应用是什么？

什么是主题建模以外的？

基于多词相似度的聚类

一种面向FastText的聚类方法

聚类相似性度量

基于pearson相关的聚类

基于最相似项目列表的聚类算法？

雪花中的自动聚类是如何工作的？

如何从其他文本中找到某些词的同义词

K-表示具有CSV的聚类(相似性，doc_id1，doc_id2)？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐