对于我的论文作业,我需要对包含从零售店(+1000维)购买数据的高维数据集执行聚类分析。因为传统的聚类算法不能很好地适用于高维数据(并且降维并不是一个真正的选择),所以我想尝试专门为高维数据开发的算法(例如ProClus)。
然而,在这里,我的问题开始了。
我不知道我应该为参数d使用什么值。有人能帮我吗?
发布于 2016-03-15 17:50:12
这只是ProClus众多限制中的一个。
该参数是集群的平均维度。它假设你的数据中有一个线性簇。这可能不适用于购买数据,但您可以尝试。对于稀疏数据,比如购买,我更愿意关注频繁项集挖掘。
没有通用的聚类算法。任何聚类算法都会附带各种参数,您需要对这些参数进行实验。
对于聚类分析,你必须能够以某种方式可视化或分析结果,以便能够找出该方法是否有效以及效果如何。
https://stackoverflow.com/questions/35990725
复制相似问题