Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >R聚类算法-层次聚类算法

R聚类算法-层次聚类算法

作者头像
Erin
发布于 2018-01-09 02:58:44
发布于 2018-01-09 02:58:44
1.7K00
代码可运行
举报
文章被收录于专栏:大数据风控大数据风控
运行总次数:0
代码可运行

层次聚类(Hierarchical Clustering算法)

层次聚类算法又称为树聚类算法,它根据数据之间的距离,透过一种层次架构方式,反复将数据进行聚合,创建一个层次以分解给定的数据集。 常用于一维数据的自动分组

层次聚类方法 hclust(dist)

  • dist 样本的距离矩阵

距离矩阵的计算方式 dist(data)

  • data 样本数据

层次聚类的代码实现:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pColumns <- c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width');

data <- iris[ , pColumns]

data.e <- dist(data)

data.m <- as.matrix(data.e)

model <- hclust(data.e)

plot(model)

result <- cutree(model, k=3)

table(iris[, 5], result)
 result
              1  2  3
  setosa     50  0  0
  versicolor  0 23 27
  virginica   0 49  1

我们可以看到,层次聚类对这份数据的聚类得到的结果并不是太好!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年07月24日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
专题2 玩转数据框
用户11064093
2024/04/15
1620
R语言之可视化(31)扫地僧easystats(2)相关性分析
相关性是一个专注于相关性分析的easystats软件包。 它轻巧,易于使用,并允许计算许多不同类型的相关性,例如偏相关性,贝叶斯相关性,多级相关性,或Sheperd的Pi相关性(鲁棒相关性的类型),距离相关(一种非线性相关性)等等,还允许它们之间进行组合(例如,贝叶斯局部多级相关性)。
用户1359560
2020/05/08
1.9K0
R语言的三种聚类方法
原文链接:https://my.oschina.net/u/1047640/blog/202714#OSC_h4_2 摘要: 层次聚类 kmeans dbscan笔记 一、距离和相似系数 r语言中
CDA数据分析师
2018/02/08
1.4K0
R语言的三种聚类方法
note-3实操
title: "note-3"output: html_documentdate: "2023-02-07"---R Markdown# 练习3-1# 1.读取exercise.csv这个文件,赋值给test。test <- read.csv("exercise.csv")# 2.求test第一列数值的中位数median(test$Petal.Length)## [1] 4.6# 3.筛选test中,Species列的值为a或c的行test[test$Species!="b",]## Petal.Le
素素
2023/02/07
1470
dplyr_下篇
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.
火星娃统计
2020/09/15
7100
Day6-李泽平-R包学习
install.packages(“包”)或者BiocManager::install(“包”)
用户11040033
2024/03/28
810
Day-6:学习R包
BiocManager::install(“包”)(R包来自Bioconductor)
用户11039713
2024/03/27
1020
Day 6_学习R包- CG
在我练习select()时,想选择刚新增的列,发现报错。然后发现运行mutate(test, new = Sepal.Length*Sepal.Width)后,查看test后发现test本身没有变。
Crazy_George
2024/03/28
1530
R聚类算法-(K-Means算法)
本文介绍了聚类算法中的R聚类算法和K-Means算法,以及如何使用R语言进行聚类分析。首先介绍了R聚类算法,然后描述了K-Means算法的基本原理和实现方法,并通过一个示例展示了如何使用R语言进行聚类分析。最后,文章对K-Means算法的优化进行了介绍,包括使用主成分分析和崖底碎石法进行优化。
Erin
2018/01/09
1.3K0
R聚类算法-(K-Means算法)
技能树Day03_直播课05-06_R作图与综合利用
属性设置:映射:根据数据的某一列的内容分配颜色;统一设置:把图形设置为一个颜色,与数据无关
sheldor没耳朵
2024/07/19
1260
技能树Day03_直播课05-06_R作图与综合利用
Day6——R包的学习
菜单栏-Tools-Packages-Primary CRAN repository-选择国内镜像
掩扉先生
2023/10/25
2120
DAY6- R包的使用
用户11039705
2024/03/28
1680
Day7-R语言综合运用
lapply(list, FUN, …) :对列表/向量中的每个元素实施相同的操作
用户11008504
2024/05/08
1120
Day6 学习R包(今天依旧是干货满满但是要注重理解)
海雀
2024/03/09
1300
学习小组day6笔记-R包
all_of(): Matches variable names in a character vector. All names must be present, otherwise an out-of-bounds error is thrown.
清南
2023/04/13
3910
学习R包
R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)。取决于你要安装的包存在于CRAN网站还是Biocductor。
用户10845197
2023/11/29
1840
R语言专题2-数据框
生信汪一昂
2023/09/16
2420
Learn R 专题1-3
图片 专题1 玩转字符串 图片 检测字符串长度 代码1 str_length(x) if(!require(stringr))install.packages('stringr') library(stringr) x <- "The birch canoe slid on the smooth planks." x [1] "The birch canoe slid on the smooth planks." str_length(x) [1] 42 ### 1.检测字符串长度,包含空格和符号 le
用户10412487
2023/03/28
1.5K0
R语言基础笔记-04(字符串、数据框、条件与循环)
ctrl+shift+m,把上一个运算的结果输入为下一个函数的第一个参数,可以省略很多中间变量
我不知道
2023/03/15
8970
R语言入门
最近在复习python的科学计算,突然心血来潮,想看看R的数据处理和python的区别在哪,所以就有了这篇文章。 R语言简介 四十多年前, R 语言的始祖诞生了 , John Chambers 在贝尔实验室中开发出S语言 ,用于快速地进行数据探索, 统计分析和可视化 。十几年后 , 新西兰奥克兰大学的 Robert Gentleman 和 Ross Ihaka 在 S 语言的基础上发明了 R 语言 。 R 语言流淌着统计学的血液 , 它内置了海量的统计函数 ,使用者可以利用其对数据进行快速交互分析 。
若与
2018/04/25
2.4K0
R语言入门
相关推荐
专题2 玩转数据框
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验