专栏首页Y大宽R检验数据是否符合正态分布

R检验数据是否符合正态分布

正态分布又叫高斯分布,很多统计学的理论都是假设所用的数据符合正态分布。所以在研究数据时,首先要看数据是否符合正态分布。

首先,R中很多安装包中有自带的数据集,所以在使用某个数据前先看它是在哪个包中。具体可以参考R各个包里面的数据集列表. 这次主要用MASS包中的crabs数据

1 直方图检验crabs对象是否正态分布

library(lattice)
library(MASS)
histogram(crabs$CW)
histogram(~CW|sex, data = crabs,col='lightblue')

解释: |是统计学符号,表示“基于.....的条件”,这里按螃蟹的性别进行区分处理。

2这条 QQ图进行检测

qqnorm()可以绘制QQ图。通过绘制的图是否呈现一直线判断是否符合正态分布。另外还有一个qqline()函数,在QQ图中绘制一条直线,QQ图中的点越接近这条直线,表示数据越接近正态分布。

qqnorm(crabs$CW, main ="QQ for Crabs")
qqline(crabs$CW)

3 shapiro.test()函数

上述判断方法相对比较主观,shapiro.test()相对比较客观。只需将检验的数据当作shapiro。test()的函数即可。

nortest1<-shapiro.test(crabs$CW)
nortest1

显示为

> nortest1

    Shapiro-Wilk normality test

data:  crabs$CW
W = 0.99106, p-value = 0.2542

p-value反应服从正态分布的概率,值越小越小的概率符合,通常0.05做标准,大于0.05则表示符合正态分布(此处为0.2542),故符合正态分布

接下来分别检验公螃蟹和母螃蟹是否符合正态分布

nortest2 <- with(crabs, tapply(CW, sex,shapiro.test))
nortest2
#结果如下
> nortest2
$F

    Shapiro-Wilk normality test

data:  X[[i]]
W = 0.98823, p-value = 0.5256


$M

    Shapiro-Wilk normality test

data:  X[[i]]
W = 0.98327, p-value = 0.2368

可见都符合正态分布。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 金黄葡萄球菌RNA-seq数据分析

    这里出现问题了,突变株的比对率太低,不到1%,这是不可能的,怀疑样品污染,然后随机挑选了5条序列blast了下,发现应该是被溶血葡萄球菌污染。

    Y大宽
  • 4️⃣ 核酸序列特征分析(8):重复序列的查找

    基因组序列主要构成成分是基因序列,重复序列和基因间序列。 基因组注释包括基因组结构注释和基因组功能注释 结构注释的核心是基因识别,为了提高基因识别效率需要首...

    Y大宽
  • 把gitbook发布在github

    如果只想用gitbook制作自己的电子书,本地观看,那只需要安装gitbook即可。现在是想部署在github。

    Y大宽
  • Confluence 6 为边栏添加自定义内容

    在边栏中,头部和脚部的字段都可以使用 wiki 的标记。请查看 guide to wiki markup 页面中的内容来获得更多的帮助,或者查看我们在本页后部分...

    HoneyMoose
  • 详解CPM定量方式

    在edgeR中,提供了一种名为CPM的定量方式,全称为count-per-millon。 假定原始的表达量矩阵为count, 计算CPM的代码如下

    生信修炼手册
  • 为什么说 TCP 协议是可靠的?

    ISO(国际标准化组织)曾提出一个 OSI 七层模型。将网络的协议划分为 7 个层,从低到高排序是:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。...

    猴哥yuri
  • 【PPT】阿里研究院:新技术,新赛道,新物种

    近日,阿里巴巴集团副总裁刘松分享了他对未来10年互联网的发展判断,他认为:数据智能将重构未来商业模式,AI产业化就是未来的商业机会,对于公司创始人而言,最需要转...

    钱塘数据
  • miRNA命名规范

    miRNA的研究起步很早,最早发现的miRNA是线虫中的let-7 和lin-4,随着越来越多的miRNA被发现,为了方便学术交流,有科学家提出了一套统一的命名...

    生信修炼手册
  • 『开发技术』解决 MacOS command not found: conda (zfh终端)

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    小宋是呢
  • 值得收藏!脑机接口概述专题二 | 从运动脑机接口到情绪脑机接口:运动脑机接口

    闭环控制的理念推动了脑机接口解码器的发展。包括调整解码器的构造和训练方式以及引导感觉运动脑机接口形成新的控制通路(图2)。类似于我们学习新的自然技能,用户可以通...

    脑机接口社区

扫码关注云+社区

领取腾讯云代金券