2. 两独立样本非参数检验 | 非参数检验汇总

飞扬 / 撰写 整理

数说君 / 编辑


1. 关于非参数检验

上一文(1. 单样本非参数检验 | 非参数检验汇总)中已经说过,相比参数检验,非参数检验不需要管那么多假设,想象这样的场景:

  • 我想检验某组数据是否符合某个分布,两组数据的分布是否有差异(废话我当然不知道他们的总体分布,不然我还检验干嘛?)
  • 我不知道两组样本的均值和方差,但我就想检验这两个总体分布是否一样;

这个时候就需要非参数检验,顾名思义,不需要理会那么多参数了。

在第一文中,介绍了单样本的非参数检验——检验某组数据是否符合某种特征,本文介绍两独立样本的非参数检验——检验两组数据的特征是否一致。方法包括:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。

2. 两独立样本的非参数检验

(1)曼-惠特尼U检验

两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断

其原假设:两组独立样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。

(2)K-S检验

K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。

这里是以变量的秩作为分析对象,而非变量值本身。

(3)游程检验

单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。

两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。

(4)极端反应检验

极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是:两独立样本来自的两总体的分布无显著差异。

基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端繁衍如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。

下一文介绍【多独立样本的非参数检验】,后续还有相关代码奉上~

原文发布于微信公众号 - 数说工作室(shushuojun)

原文发表时间:2016-11-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法工程师

LSTM模型与前向反向传播算法

在循环神经网络(RNN)模型与前向反向传播算法中,我们总结了对RNN模型做了总结。由于RNN也有梯度消失的问题,因此很难处理长序列的数据,大牛们对RNN做了改...

68530
来自专栏瓜大三哥

感知器神经网络

感知器是一种前馈人工神经网络,是人工神经网络中的一种典型结构。感知器具有分层结构,信息从输入层进入网络,逐层向前传递到输出层。根据感知器神经元变换函数、隐层数以...

269100
来自专栏IT派

入门 | 了解神经网络,你需要知道的名词都在这里

近日,Mate Labs 联合创始人兼 CTO 在 Medium 上撰文《Everything you need to know about Neural Ne...

36780
来自专栏机器之心

徒手实现CNN:综述论文详解卷积网络的数学本质

选自arXiv 机器之心编译 参与:黄小天、路雪、蒋思源 近日南洋理工大学研究者发布了一篇描述卷积网络数学原理的论文,该论文从数学的角度阐述整个卷积网络的运算与...

399110
来自专栏机器学习AI算法工程

机器学习——感知器学习算法

这里开始介绍神经网络方面的知识(Neural Networks)。首先我们会介绍几个监督式学习的算法,随后便是非监督式的学习。 一、感知器学习算法基本介绍 1...

46080
来自专栏wOw的Android小站

[MachineLearning] 激活函数Activation Function

神经网络中激活函数的主要作用是提供网络的非线性建模能力,如不特别说明,激活函数一般而言是非线性函数。假设一个示例神经网络中仅包含线性卷积和全连接运算,那么该网络...

19210
来自专栏人工智能头条

小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码)

58880
来自专栏marsggbo

Andrew Ng机器学习课程笔记--week7(SVM)

本周主要学习SVM 一、 内容概要 Large Margin Classification Optimization Objective(优化Objectiv...

22580
来自专栏人工智能

卷积神经网络初探索

卷积神经网络 当处理图像时,全连接的前馈神经网络会存在以下两个问题: 图像不能太大。比如,输入图像大小为 100 × 100 ×3(即图像高度为 100, 宽度...

20770
来自专栏智能算法

机器学习三人行(系列六)----Logistic和Softmax回归实战剖析(附代码)

本文主要实战Logistic回归和softmax回归在iris数据集上的应用,通过该文章,希望我们能一起掌握该方面的知识。 1. Logistic回归 我们在系...

723100

扫码关注云+社区

领取腾讯云代金券