我有一组多元(2D)高斯分布(用均值和方差表示),并希望对这些分布进行聚类,以保持概率高斯信息(也许使用方差的重叠?)。
我对聚类方法做了一些研究,发现DBSCAN聚类比K均值更合适,因为我不知道我希望找到多少集群。然而,DBSCAN使用欧氏距离epsilon值来寻找簇,而不是使用每个分布的方差。我也研究过高斯混合模型方法,但是它们将一组点拟合成一组K高斯簇,而不是将簇拟合成一组高斯分布。
有没有人知道可能适合我的需求的其他集群方法?
谢谢!
发布于 2016-09-24 16:20:39
DBSCAN可用于任意距离。它不限于欧几里得距离。您可以使用散度度量,例如,您的高斯人重叠了多少。
然而,我建议分层聚类或高斯混合建模(EM)。
DBSCAN的设计是为了允许香蕉形状的星系团,这不是很好的接近高斯人。你的目标似乎是合并类似的高斯人。这是通过分层聚类更好地实现的。
https://stackoverflow.com/questions/39672664
复制相似问题