BIRCH算法全称如下
Balanced Iterative Reducing and Clustering Using Hierarchies
属于树状结构的层次聚类算法的一种,其树状结构的构建是自上而下的...对于BIRCH算法而言,主要的步骤就是构建CF tree, 树状结构构建好之后,后续还可以有些可选步骤,常见的可选步骤如下
1. 去除异常的CF点,通常是包含样本较少的CF
2....利用CF节点的质心,对样本点进行聚类
在scikit-learn中,使用BIRCH聚类的代码如下
>>> from sklearn.cluster import Birch
>>> X = [[0, 1...], [0.3, 1], [-0.3, 1], [0, -1], [0.3, -1], [-0.3, -1]]
>>> brc = Birch(n_clusters=None)
>>> brc.fit(...X)
Birch(n_clusters=None)
>>> brc.predict(X)
array([0, 0, 0, 1, 1, 1])
BIRCH算法的优点是节约内存,聚类速度快,可以不用指定聚类的类别数目