首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

多重线性回归方法(一)

作者:菁悦 审核:X 封面:自己想吧

前言:

我们知道,在多重线性回归操作过程中,对自变量有5种处理方法,即强迫引入法、逐步引入法、强迫剔除法、向后剔除法、向前引入法。而强迫引入法(即输入)是指将全部的自变量全部引入方程中,本篇文章将详细介绍其具体操作。

我们仍根据案例来进行说明。

【栗子】目前大气污染越来越严重,污染物严重危害人体健康。研究者通过观察测量一些污染物(二氧化硫、氮氧化物和飘尘)的浓度,测定环境大气污染程度与上述污染物浓度的相关程度。

Step 1:打开文件,点击【分析】——【回归】——【线性】。

Step 2:将左侧的“污染程度”选到右侧“因变量”位置,将“二氧化硫、氮氧化物、飘尘”选到右侧“块”位置,注意此处的“方法”应选择【输入】。点击【统计】。

Step 3:选择【估算值】、【置信区间】、【模型拟合】、【描述】、【部分相关性和偏相关性】、【共线性诊断】、【德宾-沃森】、【个案诊断】,点击【继续】。

Step 4:点击【保存】,选择【未标准化】、【标准化】、【单值】和【包括协方差矩阵】,点击【继续】。

Step 5:选择【图】,将“ZRESID”和“ZPRED”选入右边对应位置,并选中【直方图】、【正太概率图】、【生成所有局部图】,点击【继续】——【确定】。

Step 6:结果分析。

1

在结果输出的“模型摘要”表格中显示了模型的拟合情况,其中复相关系数R为0.977,反映了所有自变量x与因变量y之间的线性相关程度,其值越大说明线性相关越密切。决定系数R方(R2)为0.955,说明空气污染程度变异的95.5%可由二氧化硫、氮氧化物和飘尘的浓度来解释。R2越接近于1,说明模型对数据的拟合程度越好。校正的R2为0.941,其意义与R2相似,也是衡量模型好坏的重要指标之一,其值越大,表示模型拟合效果越好。

2

3

在结果输出的ANOVA表格中显示了检验回归模型整体意义的方差分析结果,其中F统计量为70.344,P

在结果输出的“系数”表格中列出了回归模型的偏回归系数(B)及其标准误(Std.Error),标准化偏回归系数(Beta),回归系数检验的t统计量及其P值(Sig.),偏回归系数B的95%可信区间(95% CI)。

结果显示只有二氧化硫的偏回归系数检验的P值

同时结果中还输出了标准化偏回归系数,其意义在于通过对偏回归系数进行标准化,从而可以比较不同自变量对因变量的作用大小

因此,最后的多重线性回归方程应为:y=3.501-6.233c(SO2).

另外,按照上面的操作,还会产生描述统计、相关性】共线性诊断、残差统计等表格,以及直方图和散点图,这些结果的分析在之前文章均有详细说明。

大家都学会了吗?多多练习哦~

扫描下方二维码,回复20180609,可获得本次案例哦~

欢迎添加

数据分析服务微信号:LYJ_312

加入社群添加微信号:spss_shequn

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180609G1FOOH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券