作者:菁悦 审核:X 封面:自己想吧
前言:
我们知道,在多重线性回归操作过程中,对自变量有5种处理方法,即强迫引入法、逐步引入法、强迫剔除法、向后剔除法、向前引入法。而强迫引入法(即输入)是指将全部的自变量全部引入方程中,本篇文章将详细介绍其具体操作。
我们仍根据案例来进行说明。
【栗子】目前大气污染越来越严重,污染物严重危害人体健康。研究者通过观察测量一些污染物(二氧化硫、氮氧化物和飘尘)的浓度,测定环境大气污染程度与上述污染物浓度的相关程度。
Step 1:打开文件,点击【分析】——【回归】——【线性】。
Step 2:将左侧的“污染程度”选到右侧“因变量”位置,将“二氧化硫、氮氧化物、飘尘”选到右侧“块”位置,注意此处的“方法”应选择【输入】。点击【统计】。
Step 3:选择【估算值】、【置信区间】、【模型拟合】、【描述】、【部分相关性和偏相关性】、【共线性诊断】、【德宾-沃森】、【个案诊断】,点击【继续】。
Step 4:点击【保存】,选择【未标准化】、【标准化】、【单值】和【包括协方差矩阵】,点击【继续】。
Step 5:选择【图】,将“ZRESID”和“ZPRED”选入右边对应位置,并选中【直方图】、【正太概率图】、【生成所有局部图】,点击【继续】——【确定】。
Step 6:结果分析。
1
在结果输出的“模型摘要”表格中显示了模型的拟合情况,其中复相关系数R为0.977,反映了所有自变量x与因变量y之间的线性相关程度,其值越大说明线性相关越密切。决定系数R方(R2)为0.955,说明空气污染程度变异的95.5%可由二氧化硫、氮氧化物和飘尘的浓度来解释。R2越接近于1,说明模型对数据的拟合程度越好。校正的R2为0.941,其意义与R2相似,也是衡量模型好坏的重要指标之一,其值越大,表示模型拟合效果越好。
2
3
在结果输出的ANOVA表格中显示了检验回归模型整体意义的方差分析结果,其中F统计量为70.344,P
在结果输出的“系数”表格中列出了回归模型的偏回归系数(B)及其标准误(Std.Error),标准化偏回归系数(Beta),回归系数检验的t统计量及其P值(Sig.),偏回归系数B的95%可信区间(95% CI)。
结果显示只有二氧化硫的偏回归系数检验的P值
同时结果中还输出了标准化偏回归系数,其意义在于通过对偏回归系数进行标准化,从而可以比较不同自变量对因变量的作用大小。
因此,最后的多重线性回归方程应为:y=3.501-6.233c(SO2).
另外,按照上面的操作,还会产生描述统计、相关性】共线性诊断、残差统计等表格,以及直方图和散点图,这些结果的分析在之前文章均有详细说明。
大家都学会了吗?多多练习哦~
扫描下方二维码,回复20180609,可获得本次案例哦~
欢迎添加
数据分析服务微信号:LYJ_312
加入社群添加微信号:spss_shequn
领取专属 10元无门槛券
私享最新 技术干货