首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

多重线性回归实例

作者:夏雨骄阳 审阅:阿X 封面:自己想吧

对数据进行多重线性回归分析常按照以下步骤:

1

根据研究目的确定因变量和自变量

现研究年收入对数和受教育年限、工作年限的关系,年收入对数为因变量,受教育年限、工作年限为自变量,共计69条数据。

2

判断有无异常值

判断方法:通过线性回归-统计-个案诊断,线性回归-保存-勾选学生化删除、库克距离、杠杆值,根据新生成的学生化删除残差、库克距离、杠杆值来判断。

Step1线性回归→【统计】,勾选【个案诊断】→【离群值】

Step2【保存】→勾选【学生化删除】,【库克距离】,【杠杆值】

新生成了三个变量SDE_1(学生化删除残差)、COO_1(库克距离)、LEV_1(杠杆值)。

结果:学生化删除残差的值在-3至3的范围内,库克距离均小于1,杠杆值均均小于0.2,不存在异常值。

3

判断数据是否满足多重线性回归假设条件

(1)因变量与所有自变量之间是否存在线性关系

Step1线性回归→【保存】→勾选【未标准化】、【学生化】、【学生化删除】,【库克距离】,【杠杆值】

Step2建立未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图

结果:未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图呈水平带状,满足因变量与所有自变量之间存在线性关系的假设。

(2)因变量与每一个自变量之间是否存在线性关系

Step1线性回归→【图】→勾选【生成所有局部图】

结果:年收入对数与受教育年限之间存在近似线性关系,年收入对数与工作年限之间存在近似线性关系。

(3)各自变量之间是相互独立的。

Step1线性回归→【统计】→勾选【共线性诊断】

结果:容差为0.940接近1,VIF为1.064接近1,不存在多重共线性。

(4)残差近似正态性

Step1线性回归→【图】→勾选【直方图】、【正太概率图】

结果:标准化残差的直方图,符合正态分布,标准化残差的正态概率图,近似一条直线,符合正态分布。

4

估计回归模型参数,建立模型

Step1【分析】→【回归】→【线性】

Step2选择因变量和自变量,【统计】选项卡中“回归系数”选择“估计”,选择“模型拟合度”,单击“继续”,单击“确定”。

结果展示

回归模型:Y=8.918+0.041X1+0.007X2

该表格展示了自变量对因变量的解释程度,即模型拟合程度,可用R^2(决定系数)来衡量。决定系数取值在0-1之间,R^2越大模型拟合程度越高。本案例中R^2=0.031,即受教育年限和工作年限对年收入对数的解释程度为3.1%,解释程度不高。

5

对模型进行假设检验

对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。

方差分析结果:F=1.055,p>0.05,说明模型Y=8.918+0.041X1+0.007X2无统计学意义。

t检验结果:常数项的p值小于0.05,具有统计学意义,X1、X2的回归系数的p值大于0.05,无统计学意义。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180608G1JVXO00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券