1. 何为非参数检验
我想检验一组是否是否符合XX分布怎么办?我想检验两个组数据均值是否相当,但又不知道各自的总体均值方差、分布....怎么办?不知道不知道,我什么都不知道,我就想做个检验,怎么办
简单粗暴的说,用非参数检验,你不用管数据是否符合某某分布,甚至极端一点,你再也不用操心数据是否满足那些假定了!
非参数检验(Nonparametrictests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。
参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
PS本系列将不会介绍几本的检验原理和公式。整理仅仅是为了方便那些想做统计检验,却又被各种假定困扰的同学,方便大家日后查找。
2. 单样本非参数检验
本文首先介绍单样本的非参数检验方法。所谓单样本非参数检验,是对单个总体的分布形态等进行推断的方法,其中包括:卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。
(1) 卡方检验
(2)二项分布检验
二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。
(3)单样本K-S检验
K-S检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。单样本K-S检验的原假设是:样本来自的总体与指定的理论分布无显著差异,理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
(4)变量值随机性检验
变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。变量值随机性检验正是解决这类问题的一个有效方法。它的原假设是:总体变量值出现是随机的。
例如,在投硬币时,如果以1表示出现的是正面,以0表示出现的是反面,在进行了若干次投币后,将会得到一个以1,0组成的变量值序列。这时可能会分析“硬币出现正反面是否是随机的”这样的问题。
变量随机性检验的重要依据是游程。所谓游程是样本序列中连续出现相同的变量值的次数。可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个1或许多个0连续出现的可能性将不太大,同时,1和0频繁交叉出现的可能性也会较小。因此,游程数太大或太小都将表明变量值存在不随机的现象。