是否有任何类型的聚类算法侧重于形成特定大小的集群?这可以说是一种分组算法,而不是一种聚类算法。
基本上,给定n个数据点和一定大小的固定组k,找出基于某些分类器的点到集合的最优分布,这将使给定组中每个点的分类器的距离最小。
这个问题似乎与集群问题非常相似,但主要的区别在于,我们关注的是特定的集群大小,而不是集群的数量。
发布于 2014-05-11 14:46:27
关于如何在ELKI中实现这样的算法,有一个教程:
http://elki.dbs.ifi.lmu.de/wiki/Tutorial/SameSizeKMeans
还请看一看约束聚类算法;尽管这些算法通常只支持“必须链接”和“不能链接”约束,而不支持大小约束。
您应该能够进行类似的修改,首先指定组大小,然后随机分配点,然后交换集群成员,只要目标函数得到改善;类似于k-意思/k-medoid。由于您可能会陷入局部极小值,请重新启动多次,并且只保留最佳状态。
也见前面的问题,例如等簇大小K-均值算法变异和等尺寸k簇中的群n点
发布于 2017-02-10 22:54:47
你提出的问题是一个组合优化问题。这是非常重要的知道你是否需要一个确切的解决方案,或你能满足一个近似的?
如果您需要精确的解决方案,那么就有一个工作主体,它专注于具有不同类型约束的集群。您提到的约束可以在此框架中编码。但是,现在应该将这种方法扩展到具有一定大小的数据集。
https://stackoverflow.com/questions/23588329
复制相似问题