简单线性回归
概述:相关分析介绍了对两个定量变量进行关联性分析的方法,通过相关系数描述二者之间的线性联系,重点研究两个变量之间线性关系的强度和方向,两变量不分主次。但在实际研究中,我们常需要通过可测或易测的变量对未知或难测的变量进行估计,以达到预测的目的,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。在不考虑其他因素条件下,分析一个自变量对另一个因素的影响的分析成为简单线性回归。
应用条件:线性 独立性 正态性 方差齐性
(1)自变量与因变量之间存在线性关系 这可以通过绘制”散点图矩阵”进行考察因变量随各自变量值的变化情况。如果因变量Yi 与某个自变量X i 之间呈现出曲线趋势,可尝试通过变量变换予以修正,常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。
(2)各观测间相互独立任意两个观测残差的协方差为0,也就是要求自变量间不存在多重共线性问题。
(3)残差e 服从正态分布N(0,σ2) 。其方差σ2= var (ei) 反映了回归模型的精度, σ 越小,用所得到回归模型预测y的精确度愈高。
(4)e 的大小不随所有变量取值水平的改变而改变,即方差齐性。
举例
例1 在某地一项膳食调查中,随机抽取了14名40-60岁的健康妇女,测得每人的基础代谢(KJ/day)与体重(kg)数据,见表11-1。试用回归分析的方法,从预测的角度来描述基础代谢(Y)如何依存于体重(X)的变化而变化的规律性。
14例中年健康妇女的基础代谢与体重的测量值
一、SPSS实现:
第一步:导入数据
第二步:进行检验的操作过程
1,点击 分析—回归—线性,打开分析对话框,先将“y“放入因变量框,将“x”放入自变量,如图所示。
第三步:结果输出与解读
结果输出:模型F值=158.361,P
R2=0.930,模型的拟合程度较好。
模型方程为y=1106.8+61.424x,截距为1106.8,回归系数为61.424,即体重每变化一个单位,基础代谢变化61.424。
二、SAS实现:
第一步:建立数据集
DATAD11_01;/*p.194 例10-1*/
INPUTx y@@;
CARDS;
50.7 4175.6 53.74435.0
37.1 3460.2 51.7 4020.8
47.8 3987.4 62.8 4970.6
67.3 5359.7 48.6 3970.6
44.6 3983.2 58.6 5050.1
71.0 5355.5 59.7 4560.6
62.1 4874.4 61.5 5029.2
;
第二步:进行检验的过程步操作
PROCREG;
MODELy=x/CLBcliclm;/*计算总体回归系数的95%置信区间*/
PLOTy*x;
RUN;
第三步:结果输出与解读
拟合诊断结果显示残差服从正态分布,残差的大小不随所有变量取值水平的改变而改变,符合方差齐性。
模型F值=158.36,P 2=0.9296,模型的拟合程度较好。
模型方程为y=1106.8+61.424x,截距为1106.8,回归系数为61.424,即体重每变化一个单位,基础代谢变化61.424。
三、STATA实现:
第一步:导入数据
第二步:进行检验的过程步操作
regress BMRweight(regress 因变量 自变量)
第三步:结果输出与解读
结果输出:
模型F值=158.36,P 2=0.9296,模型的拟合程度较好。
模型方程为y=1106.8+61.424x,截距为1106.8,回归系数为61.424,即体重每变化一个单位,基础代谢变化61.424。
大话说
人世间,或许你本是烙在他心头的一颗朱砂,最后却成了一朵让他可望而不可及的彼岸花。不知是光阴的交错还是轮回的因果,有种爱,永远只离你一转身的距离,一旦开始,永无结束。
人世间,或许你本是烙在他心头的一颗朱砂,最后却成了一朵让他可望而不可及的彼岸花。不知是光阴的交错还是轮回的因果,有种爱,永远只离你一转身的距离,一旦开始,永无结束。
作者:路晓梅
编辑:Aachen
校对:大话统计工作组
领取专属 10元无门槛券
私享最新 技术干货