文章/答案/技术大牛

发布

社区首页 >问答首页 >KMeans与DBSCAN

问KMeans与DBSCAN
EN

Data Science用户

提问于 2019-02-23 19:55:38

回答 2查看 10.9K关注 0票数 2

我正在尝试理解一些基本的聚类技术。KMeans和DBSCAN的主要区别是什么？对于相同的问题，我们可以使用这两种技术吗？

clustering

k-means

dbscan

machine-learning

回答 2

Data Science用户

发布于 2019-03-26 14:30:04

简而言之，KMeans是一种基于距离的集群技术，根据初始化(通常是kmeans++)和集群之间的数据点之间的距离。在kmeans中，您初始化集群中心，然后查找每个点与每个集群之间的距离，然后将点聚到它们最近的中心。这里，我们解决的优化问题是找到簇的no，使距离每个点的距离和最近的聚类最小。

kmeans的缺点是

不管数据是如何分散的，the都会尝试创建相同大小的集群。
对于非球状结构来说，Kmeans不太好用。
Kmeans不关心数据的密度
维数的诅咒因使用距离度量而影响高维数的k均值。

DBSCAN通过处理点的密度来解决kmeans的一些问题。这是一种基于密度的方法。DBSCAN的主要假设是两个稠密区域被一个稀疏区域分开。由于DBSCAN的工作密度，它可以很容易地模拟非球状结构。这是DBSCAN的高级概述，我可以详细介绍，但这本身就是一个单独的博客。希望能帮上忙

票数 7

Data Science用户

发布于 2019-02-24 12:11:02

主要的区别在于，它们的工作方式完全不同，并且解决了不同的问题。

Kmeans是最小二乘优化，而DBSCAN则发现密度连通区域.

哪种技术适合使用取决于您的数据和目标。如果你想最小化最小二乘，使用k-均值。如果要查找密度连接区域，请使用DBSCAN。

欲知更多详情，请参阅教科书。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/46106

复制

相似问题

问KMeans与DBSCAN
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KMeans与DBSCANEN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KMeans与DBSCAN
EN