K-Means是让所有同学走到房间里,然后再整体分类。如果是数据流怎么办呢?K-Means显然做不到。
1975年,Sequential Leader Clustering 诞生了。
这是一个非常高效的分类方法,不需要迭代,不需要预先指定分类!
核心思想:
进入的第1个点,分为一类。
进入的第2个点,计算和第一个点是否小于阈值(用户预先定义),如果小于阈值,则归为一类,否则独立分类。
进入的第N个点,计算和之前点的距离,要么加入已有分类,要么单独分类。
……
牛逼的算法就是如此简单和高效!
领取专属 10元无门槛券
私享最新 技术干货