首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >KMeans与DBSCAN

KMeans与DBSCAN
EN

Data Science用户
提问于 2019-02-23 19:55:38
回答 2查看 10.9K关注 0票数 2

我正在尝试理解一些基本的聚类技术。KMeans和DBSCAN的主要区别是什么?对于相同的问题,我们可以使用这两种技术吗?

EN

回答 2

Data Science用户

发布于 2019-03-26 14:30:04

简而言之,KMeans是一种基于距离的集群技术,根据初始化(通常是kmeans++)和集群之间的数据点之间的距离。在kmeans中,您初始化集群中心,然后查找每个点与每个集群之间的距离,然后将点聚到它们最近的中心。这里,我们解决的优化问题是找到簇的no,使距离每个点的距离和最近的聚类最小。

kmeans的缺点是

  • 不管数据是如何分散的,the都会尝试创建相同大小的集群。
  • 对于非球状结构来说,Kmeans不太好用。
  • Kmeans不关心数据的密度
  • 维数的诅咒因使用距离度量而影响高维数的k均值。

DBSCAN通过处理点的密度来解决kmeans的一些问题。这是一种基于密度的方法。DBSCAN的主要假设是两个稠密区域被一个稀疏区域分开。由于DBSCAN的工作密度,它可以很容易地模拟非球状结构。这是DBSCAN的高级概述,我可以详细介绍,但这本身就是一个单独的博客。希望能帮上忙

票数 7
EN

Data Science用户

发布于 2019-02-24 12:11:02

主要的区别在于,它们的工作方式完全不同,并且解决了不同的问题。

Kmeans是最小二乘优化,而DBSCAN则发现密度连通区域.

哪种技术适合使用取决于您的数据和目标。如果你想最小化最小二乘,使用k-均值。如果要查找密度连接区域,请使用DBSCAN。

欲知更多详情,请参阅教科书。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/46106

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档