前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >主成分分析、K均值聚类R语言实现小实例

主成分分析、K均值聚类R语言实现小实例

作者头像
用户7010445
发布2020-03-03 15:01:29
1.4K0
发布2020-03-03 15:01:29
举报
数据集

3 种葡萄酒;测量13个指标;总共178个样本

数据集下载链接 https://acadgildsite.s3.amazonaws.com/wordpress_images/r/wineDataset_Kmeans/Wine.csv

主成分分析
主成分分析是一种旋转数据集的方法,旋转后的特征在统计上不相关。在做完这种旋转后,通常是根据新特征对解释数据的重要性来选择他的一个子集。
--《Python机器学习基础教程》
代码语言:javascript
复制
df<-read.csv("Wine.csv",header = T)
head(df)
df$Customer_Segment<-as.factor(df$Customer_Segment)
summary(df)
dim(df)
winepca<-prcomp(df[,1:13],scale. = T)
library(factoextra)
fviz_eig(winepca,addlabels = T)
fviz_pca_ind(winepca,col.ind = df$Customer_Segment,
             addEllipses = T,geom=("point"),legend.title="")

image.png

image.png

K均值聚类

原文链接 Analyzing Wine dataset using K-means Clustering

K均值聚类是最简单也是最常用的聚类算法之一。他试图找到代表数据特定区域的簇中心。算法交替执行以下两个步骤:将每个数据点分配给最近的簇中心,然后将每个簇中心设置为所分配的所有数据点的平均值。如果簇的分配不在发生变化,那么算法结束。

--《Python机器学习基础教程》

代码语言:javascript
复制
library(factoextra)
df<-read.csv("Wine.csv",header = T)
winescale<-scale(df[,1:13])
head(winescale)
fviz_nbclust(winescale,kmeans,method='wss')+
  geom_vline(xintercept=3,linetype=5,col="darkred")
winekmeans<-kmeans(winescale,3,nstart=25)
winekmeans
winekmeans$centers
winekmeans$size
fviz_cluster(object=winekmeans,data=winescale,ellipse.type = "norm",
             geom = ("point"),palette='jco',main="",
             ggtheme=theme_minimal())

image.png

image.png

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据集
  • 主成分分析
  • 主成分分析是一种旋转数据集的方法,旋转后的特征在统计上不相关。在做完这种旋转后,通常是根据新特征对解释数据的重要性来选择他的一个子集。
  • --《Python机器学习基础教程》
  • K均值聚类
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档