我正在尝试理解一些基本的聚类技术。KMeans和DBSCAN的主要区别是什么?对于相同的问题,我们可以使用这两种技术吗?
发布于 2019-03-26 14:30:04
简而言之,KMeans是一种基于距离的集群技术,根据初始化(通常是kmeans++)和集群之间的数据点之间的距离。在kmeans中,您初始化集群中心,然后查找每个点与每个集群之间的距离,然后将点聚到它们最近的中心。这里,我们解决的优化问题是找到簇的no,使距离每个点的距离和最近的聚类最小。
kmeans的缺点是
DBSCAN通过处理点的密度来解决kmeans的一些问题。这是一种基于密度的方法。DBSCAN的主要假设是两个稠密区域被一个稀疏区域分开。由于DBSCAN的工作密度,它可以很容易地模拟非球状结构。这是DBSCAN的高级概述,我可以详细介绍,但这本身就是一个单独的博客。希望能帮上忙
发布于 2019-02-24 12:11:02
主要的区别在于,它们的工作方式完全不同,并且解决了不同的问题。
Kmeans是最小二乘优化,而DBSCAN则发现密度连通区域.
哪种技术适合使用取决于您的数据和目标。如果你想最小化最小二乘,使用k-均值。如果要查找密度连接区域,请使用DBSCAN。
欲知更多详情,请参阅教科书。
https://datascience.stackexchange.com/questions/46106
复制相似问题