前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多元统计分析:聚类分析

多元统计分析:聚类分析

作者头像
yiyun
发布2022-04-01 14:29:39
1.1K0
发布2022-04-01 14:29:39
举报
文章被收录于专栏:yiyun 的专栏yiyun 的专栏

简介

步骤

1. 选择距离公式

代码语言:javascript
复制
dist(X, method = "euclidean", p = 2)

method 有 euclidean, maximum, manhattan, canberra, (binary 或 minkowski) p 为 Minkowski 距离的幂次,默认为 p = 2(欧氏距离)

  1. 明氏距离(Minkowski)

明氏距离 分为: 当 q = 1 时 ---> 绝对值距离(Manhattan) 当 q = 2 时 ----> 欧氏距离(Euclidean) 当

q=∞

时 -----> 切比雪夫距离(Maximum)

  1. 马氏距离(Manhattan)
  2. 兰氏距离(Canberra)

PS:TODO:突然发现 马氏距离和绝对值距离的英文怎么一样

2. 选择系统聚类方法

系统聚类法(Hierachical Clustering Method)

代码语言:javascript
复制
hclust(D, method = "complete", ...)

method 有 single, complete, average, mcquitty, median, centroid, ward.D, ward.D2 D 为 相似矩阵,通常为 距离矩阵

1. 最短距离法(single)

2. 最长距离法(complete)

3. 中间距离法(median)

4. 类平均法(average)

5. 重心法(centroid)

6. 离差平方和法(Ward)

3. 聚类图

代码语言:javascript
复制
plot(hc)

4. 分类框

代码语言:javascript
复制
# 注意;分类框一定要与plot一起执行,因为是要 加在聚类图上
plot(hc);rect.hclust(hc, 4) # 分4类 加4分类框

5. 分类结果

代码语言:javascript
复制
cutree(hc, 4) # 分4类 显示分类结果

Q&A

补充

参考

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-12-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 步骤
    • 1. 选择距离公式
      • 2. 选择系统聚类方法
        • 1. 最短距离法(single)
        • 2. 最长距离法(complete)
        • 3. 中间距离法(median)
        • 4. 类平均法(average)
        • 5. 重心法(centroid)
        • 6. 离差平方和法(Ward)
      • 3. 聚类图
        • 4. 分类框
          • 5. 分类结果
          • Q&A
          • 补充
          • 参考
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档