数据分析之对应分析

还有一种探索性分析方法叫做对应分析。对应分析能够把一个交叉表结果通过图形的方式展现出来,用以表达不同变量之间以及不同类别之间的关系。对应分析实际也是“降维”方法的一种,它比较适合对分类变量进行研究。

文/黄成甲

对应分析

对应分析是一种多元分析统计技术。主要用于研究分类变量构成的交叉表,已揭示变量间的关系,并将交叉表的信息以图形的方式展示出来。它主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别之间的对应关系。简单说,对应分析就是交叉表的图形化。对应分析看似是一种作图的技术,实际上难点在于变量的选择。有些变量被忽视掉之后,分析结果就可能以偏概全,没有揭示变量间真正的关系。所以在通常情况下,可以通过尝试不同变量的组合,以发现具有价值的信息。而对应分析的作用就是用图形的方式表达分类变量之间的关系。

对应分析主要应用于产品定位、品牌研究、市场细分、竞争分析、广告研究等领域,因为它是一种图形化的数据分析方法,它能够将几组看似没有联系的数据,通过视觉上可以接受的定位图展现出来。

对应分析的优劣势

优势:(1)揭示行变量类别间与列变量类别间的关系;(2)将变量之间各个类别的关系直观地表现在图形中;(3)分类变量划分的类别越多,优越性越明显;(4)计算简单,实现容易;

劣势:(1)只能用图形的方式提示变量间的关系,但不能给出具体统计量来度量变量间的关系;(2)输出的维度个数需要研究人员自行决定,对应分析本身无法提供最佳维度个数的判断;(3)分析结果容易受到极端值的影响。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

Netflix工程总监眼中的分类算法:深度学习优先级最低

1666
来自专栏FSociety

朴素贝叶斯算法介绍及优化

公式就不在这推导了,理解起来也很简单的,画个venn图就行,我们接下来通过例子来看贝叶斯公式是如何应用在分类问题中的。 假如我们现在有如下样本:

3563
来自专栏机器之心

学界 | 精细识别现实世界图像:李飞飞团队提出半监督适应性模型

3527
来自专栏腾讯社交用户体验设计

数据图表设计(一)--遇见大数据可视化系列文章之五

2194
来自专栏大数据文摘

LeCun、Bengio、Hinton三巨头曾合体,Nature发文综述深度学习(论文精华)

4554
来自专栏CSDN技术头条

Netflix工程总监眼中的分类算法:深度学习优先级最低

【编者按】针对Quora上的一个老问题:不同分类算法的优势是什么?Netflix公司工程总监Xavier Amatriain近日给出新的解答,他根据奥卡姆剃刀原...

2135
来自专栏机器之心

深度 | Pedro Domingos总结机器学习研究的12个宝贵经验

36610
来自专栏about云

机器学习工程师|数据科学家面试流程介绍(含面试题)

问题导读 1.机器学习工程师面试的流程是什么? 2.本文典型的第一轮面试由哪三部分组成? 3.对于基本的常识问题你是否有更好的理解及答案?

1244
来自专栏AI科技评论

学界 | CVPR 2018论文解读:让神经网络学习比较来实现少样本学习

方法非常简单通用,但效果很不错,在少样本学习及零样本学习的几个基准数据集上都取得了相当好的结果。

1633
来自专栏大数据挖掘DT机器学习

欺诈预测机器学习模型设计:准确率和召回率

Airbnb网站基于允许任何人将闲置的房屋进行长期或短期出租构建商业模式,来自房客或房东的欺诈风险是必须解决的问题。irbnb信任和安全小组通过构建机器学习模型...

3184

扫码关注云+社区

领取腾讯云代金券