前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Data Science】| 判断数据是否服从正态分布

【Data Science】| 判断数据是否服从正态分布

作者头像
作图丫
发布2022-03-29 14:39:01
3.4K0
发布2022-03-29 14:39:01
举报
文章被收录于专栏:作图丫

很多时候,我们都需要基于单一样本中反映出的信息,利用统计推断的方法、去估计样本总体的参数信息,我们耳熟能详的统计方法太多了:t检验,方差检验,U检验,F检验……但这些检验方法你真的用对了吗?

在进行统计推断前,你一定要首先了解数据分布,否则得到的统计结论就是无效的!比如,T检验、方差检验的前提假设都是数据呈正态分布,如果你的数据不满足正态分布,则需要转化成正态分布或使用非参数检验方法。小编今天带大家了解一下,如何判断数据是否服从正态分布呢?!

今天我们邀请“SPSS”,帮助我们判断数据是否服从正态分布:

假设我们有一组数据,列是不同的样本,行是每个样本的免疫细胞浸润得分,想判断DataSet1这个样本的免疫细胞浸润程度是否服从正态分布。

方法一.

Step1.打开SPSS,在顶端的工具栏选择“分析-->描述统计-->探索”:

Step2.在弹出的选项中将目标数据名称加入到“因变量列表”中,点击“绘图”,勾选“茎叶图”“直方图”“带检验的正态图”:

Step3.得到如下图所示结果,进行解读:

(描述性)结果解读,关注峰度系数和偏度系数两个参数:

1)当偏度=0,峰度=0时,分布呈正态;

2)当偏度>0时,呈正偏态,当偏度<0,呈负偏态。

3)当峰度>0时,曲线比较陡峭,当峰度<0时,曲线比较平坦。

(常态性检验)结果解读,利用两种检验方法KS检验和Shapio-Wilk检验,判断数据是否呈正态分布:

p>0.05,所以数据呈正态分布。

方法二.

Step1.打开SPSS,在顶端的工具栏选择“分析-->描述统计-->频率”:

Step2.在弹出的选项中将目标数据名称加入到“变量”中,点击“图表”,勾选“直方图”“在直方图上显示正态曲线”:

Step3.得到如下图所示结果,可以直观判断数据是否服从正态分布。

方法三.

Step1.打开SPSS,在顶端的工具栏选择“分析-->描述统计-->Q-Q图”:

Step2.在弹出的选项中将目标数据名称加入到“变量”中,其余选项默认:

Step3.得到如下图所示结果,可以直观判断数据是否服从正态分布。

当然,还有很多直观方法,如P-P图,它与Q-Q图的操作方法类似,可以直观反应数据是否服从正态分布。还有很多检验方法,除了我们今天用到的KS检验(又称D检验),Shapiro-Wilk检验(又称W检验),还有Lilliefors检验,Anderson-Darling(又称AD检验),Ryan-Joiner检验等,与大家分享!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档