前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【V课堂】R语言十八讲(十五)—-置换检验和自助法

【V课堂】R语言十八讲(十五)—-置换检验和自助法

作者头像
小莹莹
发布2018-04-23 10:13:27
1.7K0
发布2018-04-23 10:13:27
举报

不知道看到这里,读者有么有发现,前面讲了那么多方法,几大检验,回归分析,方差分析“都有一个共同的特点,那就是有一定的前提假设,只有满足这个假设时,模型才有较好的效果.我们可以来回顾一下:

线性回归

因变量呈正态分布,齐方差性,独立,与自变量是线性关系,无离群点。

方差分析

因变量呈正态分布,各组齐方差还有其他的回归斜率相同等等

T检验

独立,来自正态总体;或者非独立,组间差异服从正态分布。

可能你会说,如果不满足正态假设,我们可以改用非参数的检验方法,比如拟合优度检验,秩和检验和符号秩检验,或者Kruskal-Wallis检验,Friedman检验.这些检验是非参数检验,但是若样本量比较小,这些检验往往效果不太好。

于是,今天给大家介绍另外一种检验方法—-置换检验.和自助法(bootstrap)

置换检验

1.与参数方法相同计算统计量记做t0

2.将所有样本放在一个组,然后随机的分配到两个组中,再计算统计量记做t(1)

3.重复2操作,直至将多有可能的组合都弄完,得到一系列的统计量t(1)到t(n)

4.讲这n个统计量按从小到大排序,组成其经验分布,然后,看t0是否落在经验分布的中间95%区间内,若在0.05的显著性水平下,t0落在中间95%区间之外,则拒绝原假设:

若第3步是将所有的可能都计算了,则称为精确检验

若第3步是将部分组合计算了,则称为近似分布,一般用蒙特卡洛模拟.

R实现:

看到两种方法还是有区别的,一个拒绝原假设,一个没有拒绝.

这里是一样的,因为秩和检验默认就是精确检验。

得到的结果基本一致。

我们发现置换法也可以处理有序的因子.它默认线性趋势分析。

通过置换的方达.我们解决了总体分布未知,样本量太小,有离群点的困惑(如果你在问,为什么置换一下就可以忽视这些假设了? 问的好,真的需要这样的想法,虽然这里我给不了解答,但你可以自己去查询)但是,置换法有一个缺点或者叫不足吧,那就是获取置信区间和估计测量精度很难.这时我们便用到另一种非参数方法—自助法。

自助法

1.从样本中随机有放回的抽样的到自助样本

2.计算统计量

3,重复步骤1和2得n个统计量,并从小到大排序.

4,在0.05显著性水平下,找出中间95%区间就是置信区间,在这区间之外的就是拒绝域(这和置换法最后一步是一样的)。

R实现:

原来的R^2是0.7809在使用自助法之后,百分位方法的置信区间是(0.6724,0.8757)使用调整偏差方法后是(0.6158,0.8538)

由于,lmperm包在R中已经不能用了,所以线性回归和方差分析的置换法,没有做,如果有读者知道怎么安装lmperm包,或者代替包,给我留言,非常感谢!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档