前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言进阶之如何正确认识判别分析和聚类分析

R语言进阶之如何正确认识判别分析和聚类分析

作者头像
生信与临床
发布2020-08-06 10:43:49
6590
发布2020-08-06 10:43:49
举报

到现在为止,我已经和大家讲解过判别分析和聚类分析了,可能有些朋友会认为这两个是一回事,在这里我需要强调一下------判别分析和聚类分析是两回事!!!

所谓判别就是判定某一样本点所属的类别,其前提是类别已经确定,由已确定的类别及相关数据来拟合模型,从而用模型去预测某一样本点所属的类别。另外,在判别分析中我们要明确:线性判别的计算量小于二次判别,但使用它的前提是各类的同方差性,如果样本足够大的话也是优先选择线性判别分析。

但是聚类分析则是对样本进行分类,在分析之前我们是不知道关于类别的相关信息,我们通过模型的拟合去给数据分类,这样我们可能会对数据有一个整体的印象。当然你也可以根据聚类的结果来预测新样本点所属的类别。

虽然我都是鸢尾花(iris)数据集为例进行讲解,但是细心的朋友应该能发现:聚类分析时我将鸢尾花种类的变量剔除掉了。判别分析中,我们在已知三类的情况下拟合模型来预测新样本所属的类别,但是聚类分析中我们不难看出将整体数据聚成两类更好。这主要是因为“versicolor”和“virginica”这两类很难用花瓣和花萼来区分,反映在判别分析中就是这两类的误判率较高,而聚类分析中就是这两个被聚成一个大类。

关于判别分析和聚类分析的区别和联系就讲到这里,希望大家能正确认识并区分。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信与临床 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档