基于度量对列表中的元素进行聚类

文章/答案/技术大牛

发布

1回答

python、python-3.x、machine-learning、cluster-analysis

我有一个字典列表，这些字典是关键字及其向量距离，我正在尝试应用聚类技术对它们进行分组 # data = [{"key": "str1", "weight": float value}, ...] mean_distances_differences = mean([j-i for i, j in zip(distances[:-1], distances[1:])]) 我计算了列表

浏览 12提问于2020-11-25得票数 1

1回答

选择k均值聚类模型的适当相似性度量

cluster-analysis、distance、k-means、unsupervised-learning

我使用k-means算法对我的数据进行聚类。我有5000个样本……(我的每个样本都是关于一个客户的。为了分析客户价值，我将基于4个行为特征对它们进行聚类。)距离是使用欧几里德度量和皮尔逊相关性计算的。我不知道欧几里德距离是计算距离的正确方法还是皮尔逊相关性？我正在使用轮廓来验证我的聚</e

浏览 4提问于2014-08-04得票数 0

2回答

基于相似性度量的图像聚类

machine-learning、r、python、scikit-learn、k-means

我正在尝试使用科学知识-学习和比辛对一组图像进行聚类-不到100。最终的目标是根据计算出的相似性度量- CW-SSIM将图像放入几个桶(簇)中。这个任务似乎很琐碎，但我无法找到最好的方法来处理基于相似性的集群，在scikit中学习。K-表示聚类看起来是个不错的选择，但它不接受任何“比较函数”或自定义距离函数。那么如何处理科学学习中</e

浏览 0提问于2016-01-10得票数 8

1回答

如何在许多CFG中应用？

clustering、graphs

我有大约1000个DAG(有向无环图)的不同文件显示java.io.BufferedReader的使用。下面是其中一个图的表示 9 [ label="9 : ROOT:setup()#0" ]; 12 [ label22 -> 34; 27 -> 34; 29 -> 34; 34 ->

浏览 0提问于2016-02-02得票数 2

1回答

K-均值分类

matlab、artificial-intelligence、k-means

我有一个数据集，我知道它有3个类。假设我想用k=10对这个数据集进行k-means分类，我会得到10个聚类。我如何将这10个集群合并到3个类中，以及基于什么规则(例如距离度量)？非常感谢

浏览 2提问于2017-01-03得票数 0

1回答

聚类中的精确度和召回率(在Spark，Scala中的应用)

scala、apache-spark、apache-spark-sql

试图解决Spark中聚类算法度量模型评估统计数据(精度和召回率)的问题。用于基于成对重叠的聚类评估的低于矿工的响应。你将如何去计算真正的积极因素？特别是对spark数据帧的变换，得到了结果。非常感谢您的启发。

浏览 0提问于2017-08-05得票数 0

1回答

基于语义相似度的分层聚类算法

python、similarity、semantics

我对整个集群和其他方面都很陌生，所以我有点迷失在编程的最后一步。我正在做一个基于主题语义相似性的项目，该项目使用层次化算法对学生进行聚类。如何用python编写代码，根据主题之间的语义相似

浏览 5提问于2022-02-15得票数 -1

2回答

在度量空间中有聚类的方法吗？

java、cluster-analysis

我想对来自Twitter的数据进行聚类。我有用户和他们的距离。我不能使用K-means，因为k-means不支持度量空间中的聚类。在度量空间中有集群的实现吗？

浏览 0提问于2013-02-20得票数 0

1回答

fft输出的实部和虚部是否相关？

r、math、fft

我想使用基于模型的聚类来对1225个时间序列(每个24个周期)进行分类。我已经使用快速傅立叶变换对这些时间序列进行了分解，并选择了至少解释样本中所有时间序列的时间序列方差的阈值百分比的谐波。我想对给定时间序列的每个变换元素的实部和虚部进行基于模型的聚类，因为

浏览 29提问于2011-11-26得票数 3

回答已采纳

1回答

三维直方图的相似性度量

image-processing、histogram、data-mining、similarity、cv2

我想根据颜色相似性对图像进行聚类。为此，我需要两个3D直方图之间的良好相似性度量。图像的3D直方图只是一个3维空间，其中每个轴代表一种基色。每个轴的范围是0-255，因为这是每个像素的基色的可能值。直方图表示为256X256X256矩阵，矩阵中的每个条目表示图像中具有该特定颜色的像素计数。例如:如果矩阵元素M[0][0][0]

浏览 0提问于2018-10-23得票数 0

3回答

基于最相似项目列表的聚类算法？

machine-learning、data-mining、clustering、dataset

我是机器学习的初学者。我有一个大型的项数据集，每个数据集中都有有限的一组最相似的项，我希望创建集群，最好是每个集群都具有相同的大小，尽管这是不必要的。有人能给我指明正确的方向吗？谢谢。

浏览 0提问于2018-04-21得票数 2

1回答

如何选择合适的聚类算法

algorithm、cluster-analysis

我将使用1000维的特征向量进行聚类。也就是说，特征向量如下所示。.，844}；...我也有度量两个特征向量之间的距离的度量。但我不能确定哪种聚类算法对这些特征向量进行聚类的效果最好，因为我无法可视化这些向量的分布，因为它们的维数很高。有谁知道可视化这些分布的方法，或者在不知

浏览 2提问于2013-11-27得票数 0

1回答

在数组中找到最相似的范围

c++、arrays、algorithm、data-structures、pattern-finding

在这里，calcSimilarity是返回两个数组相似性的函数。相似度计算为不像蛮力搜索那样，我想知道什么样的数据结构和算法在范围搜索中是有效的。

浏览 4提问于2017-10-04得票数 1

回答已采纳

2回答

如何计算dtw聚类的质量？

r、time-series、cluster-analysis、distance

我的目标是对关于26周的126个时间序列进行聚类(因此每个时间序列有26个观察值)。我在medoids周围使用了pam{cluster} = partitioning来对这些时间序列进行聚类。在聚类之前，我想比较哪种距离度量最合适:欧几里得、曼哈顿或动态时间扭曲。我使用每个距离通过轮廓图进行聚类和比较。有什么方

浏览 1提问于2014-04-25得票数 2

1回答

可训练簇监督聚类或组ID分配的ML纪律名称

machine-learning、neural-network、classification

是否有一个机器学习算法的名称，它从聚类数据点的例子中学习“聚类方法”(每次使用不同数量的集群)？有没有人在任何文献中遇到过类似的问题？我的目标是阅读更多关于这个问题的内容。而且我们不知道最初的故事，而只知道(数据点->他们的分组)的实例。编辑:也许聚类这

浏览 0提问于2017-12-11得票数 0

回答已采纳

1回答

时间序列聚类质量度量

clustering、time-series、unsupervised-learning、performance

我是聚类时间序列数据集，这些数据集没有标签(没有根据事实)，我想衡量集群的质量。你能不能建议一下可以用于时间序列聚类的聚类性能评估方法？

浏览 0提问于2018-10-06得票数 1

2回答

稀疏矩阵中聚类元素的距离度量

cluster-analysis、data-mining、distance、sparse-matrix、k-means

我正在尝试使用K-means基于大约1200个二进制变量对大约12000个元素进行聚类。传统的距离度量(欧几里得、曼哈顿、汉明、Levenshtein)都没有产生令人满意的结果。有没有人使用过类似的方法来解决这类问题？使用这个指标有什么明显的缺陷吗？我是数据挖掘的新手，如果有任何反馈，我将

浏览 0提问于2011-03-10得票数 2

1回答

将聚类结果绘制并可视化为网络图

python、matplotlib、graph、cluster-analysis、networkx

我正在Python中试验各种聚类算法和字符串距离度量，最终目标是根据各种距离度量对字符串列表进行聚类，例如Levenshtein、Jaro等(每个字符串通常有1到2个单词)。我已经构建了代码，用于根据不同的距离度量计算字符串之间的距离(使用jellyfish包)，并使用sklearn.cluster包提供的不同算法对它们进行集群

浏览 0提问于2018-11-06得票数 1

1回答

如何使用LDA或任何主题建模算法获取文档的意图

machine-learning、nlp、lda、topic-modeling

我需要基于文档的意图对一组文档进行聚类，我计划使用LDA(潜在Dirichlet分配-主题建模)。我一直在尝试LDA算法进行主题建模，

浏览 0提问于2019-08-20得票数 0

4回答

监督聚类

clustering、unsupervised-learning、supervised-learning、semi-supervised-learning

我正在处理一个聚类问题。我有一个训练集，它由一组已知聚类的点组成，我希望在测试数据集中找到好的集群。这是一种监督聚类。我找了一些关于监督聚类的文章，但是我没有找到很多信息。有“半监督聚类”，它包括使用关于点对(必须链接或不链接关系)的信息，但是，在我的任务中，我没有这样的信

浏览 0提问于2019-09-22得票数 2

点击加载更多