专栏首页日常撸知识如何判断一个数据分布是否是正太分布?

如何判断一个数据分布是否是正太分布?

在数据分析过程中,得到一组数据,在分析之前,通常需要判断数据是否符合正态分布与否,再决定下一步分析方法。那么,如何判断数据是否属于正太分布呢?

其中一种方法就是画出正太分位数图,用以判断数据是否数据正太分布。

什么是正太分位数图呢?

将一个正态分布的数据集的数据从小到大排序,求每个值在样本中出现的概率,再累积画出如下图。如下图是一个均值为5.5的正太分布累计概率图。在开始和结束的位置概率增长率最小,在均值处概率增长率最大。

上图中,如果将开始和结束的位置坐标轴拉长,可以将这条曲线转化得到一条直线。再画出95%置信区间下的概率累计图,就能够知道如下的图:

两条虚线为95%置信区间下的概率图。再需要判断数据是否属于正太分布式,如果数据分布在两条虚线之间,则可以认为数据是数据正太分布的。否则,不是正态分布。

-----END-----

本文分享自微信公众号 - 小末快跑(Faster_Future),作者:小末快跑

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 统计学之假设检验

    P-值规则:先把显著性水平α值转化为一定分布下的临界值,然后在计算检验统计值,最后把检验统计值与临界值相互比较来判断是否拒绝原假设。在双侧检验时,α平分在两侧,...

    小末快跑
  • MySQL创建计算字段及基本函数

    select concat(vend_name,'(',vend_country,')') from vendors order by vend_name;

    小末快跑
  • 一些统计学基础知识,Statistics basics

    全距:最大值与最小值的差。仅描述数据的宽度,并没有描述数据上界和下届间数据的分布。

    小末快跑
  • 让你效率迅速提升 5 倍的 10 个 Excel 数据清洗技巧

    根据 Forbes 一次针对数据科学家的调查显示,收集、整理和清洗数据占据了数据科学家 80%的工作时间。

    小马哥的牛棚
  • 目标跟踪与定位——Robot Localization

    事件X可以有多个结果,称之为X1,X2,等; X的所有结果的概率必须加起来为1。例如,假设有两种可能的结果,X1和X2:

    小飞侠xp
  • 多种批次效应去除的方法比较

    前面我在生信技能树推文:你确定你的差异基因找对了吗? 提出了文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分,而是不同人之间的异质性非常高,这个...

    生信技能树
  • 何为大数据分析?

    大数据的分析从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多...

    Spark学习技巧
  • 【学习】干货收藏:如何进行大数据分析及处理?

    众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 那么越来越多的应用涉及...

    小莹莹
  • 叠加分析

    首先,GIS的核心是空间分析!那么什么是叠加分析呢?在邬伦教授等主编的《地理信息系统——原理、方法和应用》 中是这样介绍的:叠加分析是地理信息系统最常用的提取空...

    数据处理与分析
  • nginx禁止用户访问遇到的问题 原

    ###问题背景 如果你的nginx作为webserver,前端用户是通过haproxy代理进来的请求,那么如果你在nginx上去直接添加deny的访问控制是达不...

    domain0

扫码关注云+社区

领取腾讯云代金券