前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R in action读书笔记(9)-第八章:回归 -回归诊断

R in action读书笔记(9)-第八章:回归 -回归诊断

作者头像
统计学家
发布2019-04-10 16:54:19
5390
发布2019-04-10 16:54:19
举报

8.3回归诊断

> fit<-lm(weight~height,data=women)

> par(mfrow=c(2,2))

> plot(fit)

为理解这些图形,我们来回顾一下oLs回归的统计假设。

口正态性当预测变量值固定时,因变量成正态分布,则残差值也应该是一个均值为0的正态分布。正态Q-Q图(Normal Q-Q,右上)是在正态分布对应的值下,标准化残差的概率图。若满足正态假设,那么图上的点应该落在呈45度角的直线上;若不是如此,那么就违反了正态性的假设。

口独立性你无法从这些图中分辨出因变量值是否相互独立,只能从收集的数据中来验证。上面的例子中,没有任何先验的理由去相信一位女性的体重会影响另外一位女性的体重。假若你发现数据是从一个家庭抽样得来的,那么可能必须要调整模型独立性的假设。

口线性若因变量与自变量线性相关,那么残差值与预测(拟合)值就没有任何系统关联。换句话说,除了自噪声,模型应该包含数据中所有的系统方差。在“残差图与拟合图”( Residuals vs Fitted,左上)中可以清楚的看到一个曲线关系,这暗示着你可能需要对回归模型加上一个二次项。

口同方差性若满足不变方差假设,那么在位置尺度图(Scale-Location Graph,左下)中,水平线周围的点应该随机分布。该图似乎满足此假设。最后一幅“残差与杠杆图”(Residuals vs Leverage,右下)提供了你可能关注的单个观测点的信息。从图形可以鉴别出离群点、高杠杆值点和强影响点。

8.3.2改进的方法

qqPlot() 分位数比较图

durbinWatsonTest()对误差自相关性做Durbin-Watson检验

crPlots()成分与残差图

ncvTest()对非恒定的误差方差做得分检验

spreadLevelPlot()分散水平检验

outlierTest()Bonferroni离群点检验

avPlots()添加的变量图形

inluencePlot()回归影响图

scatterplot()增强的散点图

scatterplotMatrix()增强的散点图矩阵

vif()方差膨胀因子

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档