首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

相关关系是怎样的关系?

在数据分析过程中,我们经常想知道两个变量之间的关系,比如在之前的推文《使用曲线估计法预测广告支出与销售业绩之间的关系》中,我们探讨了广告费用与销售额之间的关系。当投入一定的广告费用时,销售额的变化带有随机不确定性,这种不能用数学函数准确度量,但又存在一定规律的关系我们称为相关关系

相关关系是一种非确定性的关系,它能够分析变量间的关联程度和关联形式,并且可以在相关分析的基础上,再通过回归分析来确定变量之间的数量关系,进而用于生产控制和预测。

因此,相关关系和函数关系的区别在于:相关关系是变量间不确定的数量关系;函数关系是变量间一一对应的确定关系,比如长方体的高与体积之间的关系是线性函数关系。

相关分析是对两个变量之间线性关系的描述和度量,探讨的主要问题是:变量之间是否存在关系?存在什么关系?关系强度如何?以及样本所反映的变量间的关系能否代表总体变量间的关系?

因此,在进行相关分析时,我们假定两个随机变量间是线性关系,如果是非线性关系,需要进行一定的数学变换将数据转换为线性关系。

如果我们需要探讨两个变量间的关系,可以使用简单散点图进行可视化探索,它是描述变量间相关关系的一种直观方法。相关关系包括线性相关、完全线性相关、曲线相关和不相关。

接下来,我将选用SPSS中的自带数据集car_sales.sav为例,向大家演示相关分析过程。这个数据文件包含假设销售估计值、订价以及各种品牌和型号的车辆的物理规格。我从中选择sales(销售额)和mpg(燃料效率)这两个随机数值变量,探索它们之间是否存在相关关系。

两变量的部分数据截图如下:

首先,我将通过绘制散点图的方式确定变量间的关系。选择菜单中的图形->图形构建器,在图库中选择散点图,双击简单散点图将它选入图表预览窗口,将sales变量拖至X轴,将mpg变量拖入Y轴,点击确定

图表对话框如下图所示:

得到的散点图如下所示:

从散点图来看,salesmpg这两个变量间不存在明显的相关关系。接下来,我们对它们进行相关分析,通过相关系数来确定两者间的相关程度。

点击分析->相关->双变量,在对话框中将两变量选入变量窗口;因为两变量均为数值型变量,所以默认选择皮尔逊(Pearson)相关系数。点击确定

对话框如下图所示:

得到分析结果如下:

相关分析的结果总是关于对角线对称的,所以我们只需要看其中一部分即可。我们看到,salesmpg这两个变量的相关系数是-0.017,显著性检验P值是0.837(P>0.05),说明两变量间不存在相关关系。

在上述案例中,我们选择的是Pearson相关系数,它适用于数值型变量,是运用最广的一种相关程度统计量。

相关系数还有两个种类:Spearman等级相关Kendall tua-b等级相关。前者适用于度量有序分类变量之间的相关程度;后者也是用来度量有序分类变量之间的线性相关关系。在进行相关分析时,要注意根据数据类型选择不同的相关系数。

最后值得大家注意的一点是:相关关系不等于因果关系!

相关关系只能说明二者间的数量关系,不能表明他们之间具有因果关系。两者之间是否存在因果关系还需要结合实际,进行一定的逻辑推理才能得出结论。

有时候,两个完全不相干的变量间也可能存在很强的相关关系,比如说:“当明星”和“长得好看”之间具有很强的相关性,但并不能说“因为当了明星,所以才长得好看”,也不能得出“因为长得好看,所以是明星”的结论。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191118A0A27700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券