前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习|聚类(下)

机器学习|聚类(下)

作者头像
数据山谷
发布2020-07-21 14:21:43
3430
发布2020-07-21 14:21:43
举报
文章被收录于专栏:数据山谷

接下来几周的时间,我们将会推出关于《西瓜书》读书笔记的连载文章,updating~

在聚类(上)中我们了解了一下聚类算法的基本原理,同时也了解了最常用的聚类算法K-Means以及相关的优化算法,对于K-Means来说,我们可以称之为原型聚类算法,本节再让我们来了解一下密度聚类和层次聚类算法。

01

密度聚类

密度聚类算法假设聚类结构能通过样本分布的紧密程度确定,一般情况下,密度聚类算法从样本密度的角度来考察样本的可连接性,并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。

密度聚类算法的主要特点:

  1. 对噪声数据不敏感
  2. 发现任意形状的簇
  3. 一次扫描
  4. 需要密度参数来作为算法停止的条件
  5. 计算量大、复杂度高

DBSCAN的概念

DBSCAN的算法思想

DBSCAN的算法流程

02

层次聚类

层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构,对于数据集的划分我们即可以采用“自底向上”的策略,也可以采用“自顶向下”的策略。层次聚类的展示图如下:

AGNES算法

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据山谷 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档