学习
实践
活动
专区
工具
TVP
写文章

菜鸟也爱数据分析之SPSS篇——卡方检验综述

作者:小王子的狐狸 审稿:在路上 封面:自己想吧

1. 什么是卡方检验呢?

卡方检验是一种判断样本是否符合特定分布的非参数检验方法,用于检验观察值与期望值是否吻合。

2. 原理

卡方检验的原假设H0为:样本所属的总体分布与理论分布无显著差异。

公式中,f0是实际观察频数,fe是期望频数。当观察频数与期望频数越接近,χ2值越小,不能拒绝原假设(零假设);观察频数与期望频数相差越大,χ2值越大,越没有证据支持原假设。

由于卡方检验是奠定在皮尔逊定理的基础上的,要求样本量要足够大,所以使用时建议样本量不应小于30,同时每个单元中的期望频数不能太小。

3. SPSS操作

以人们对数字有没有特别的偏好为例,以50名受访者为观察对象,在数字6-9中选择一个数字。

(1)卡方检验对话框

选择“分析”—“非参数检验”—“旧对话框”—“卡方”命令,弹出“卡方检验”对话框。如图1.1所示,“检验变量列表”框中移入了本次例子中需要比较的变量“prefernumber”。

图1.1 “卡方检验”对话框

Tips:检验变量列表中,可以选择多个变量,SPSS会分别对各个变量进行卡方检验。

(2)设置相应选项

“期望范围”选项组

该选项组用于确定卡方检验的数据范围。系统默认“从数据中获取”,SPSS将使用数据中的最大值和最小值作为检验范围;“使用指定范围”,需手动输入“上限”和“下限”数据来确定范围。

“期望值”选项组

该选项组用于设置总体中各分类所占的比例,包括“所有类别相等”和“值”选项。“所有类别相等”是系统默认选择,即检验总体是否服从均匀分布;若选择“值”,则用户需输入指定分组的期望值。需要注意的是:值输入的顺序要与检验变量递增的顺序相同。

“精确”按钮

若单击“精确”按钮,则弹出如图1.2所示的“精确检验”对话框。

图1.2 精确检验对话框

精确检验用于设置计算显著性水平的方法,有3种方法:

仅渐进法:系统默认设置,表示显著性水平的计算基于渐进分布假设。渐进方法要求足够大的样本容量,如果样本容量偏小,该方法将会失效。

蒙特卡洛法:一般用于不满足渐进分布假设的巨量数据。使用时,应在“置信度级别”和“样本数”输入相应数据。

精确:该方法可以得到精确的显著性水平,但是缺点是计算量过大。用户可以设置相应的计算时间,如果超过该时间,SPSS将自动停止计算并输出结果。

若单击“选项”按钮,则打开如图1.3所示。

图1.3 选项对话框

“选项”对话框包括“统计”和“缺失值”两个选项组。

“统计”选项组:用于设置输出的统计量,包括“描述性”和“四分位数”两个复选框,本例就选择了“描述性”框。

“缺失值”选项组:该选项组用于设置缺失值的处理方式,包括“按检验排除个案”和“成列排除个案”两个单选项,前者是指如果指定多个检验,将分别独立计算每个检验中的缺失值;后者表示从所有分析中排除任何变量具有缺失值的个案。

(3)分析结果输出

本例中,得出如图1.4、1.5和1.6的结果。

图1.4描述统计结果

图1.4给出了“个案数”、“平均值”、“标准差”、“最小值”和“最大值”等描述性统计量;

图1.5 卡方检验频数表

图1.5 给出了实际个案数、期望个案数以及残差值。

图1.6 卡方检验统计表

图1.6给出了相应的检验统计量。从表中可以看出,渐近显著性P值为0.451,我们不能拒绝原假设,所以认为人们对数字6-9没有特别偏好。

后面的文章会给大家一一介绍拟合度检定、适合度检定、同质性检定等。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180226G1EC2E00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券