飞扬 / 撰写 整理
数说君 / 编辑
1. 关于非参数检验
上一文(1. 单样本非参数检验 | 非参数检验汇总)中已经说过,相比参数检验,非参数检验不需要管那么多假设,想象这样的场景:
这个时候就需要非参数检验,顾名思义,不需要理会那么多参数了。
在第一文中,介绍了单样本的非参数检验——检验某组数据是否符合某种特征,本文介绍两独立样本的非参数检验——检验两组数据的特征是否一致。方法包括:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。
2. 两独立样本的非参数检验
(1)曼-惠特尼U检验
两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。
其原假设:两组独立样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。
(2)K-S检验
K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。
这里是以变量的秩作为分析对象,而非变量值本身。
(3)游程检验
单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。
两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。
(4)极端反应检验
极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是:两独立样本来自的两总体的分布无显著差异。
基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端繁衍。如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。
下一文介绍【多独立样本的非参数检验】,后续还有相关代码奉上~