前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >偏度和峰度的计算

偏度和峰度的计算

作者头像
全栈程序员站长
发布2022-09-20 16:11:41
5K0
发布2022-09-20 16:11:41
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

偏度(skewness)和峰度(kurtosis):

偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。

峰度反应的是图像的尖锐程度:峰度越大,表现在图像上面是中心点越尖锐。在相同方差的情况下,中间一大部分的值方差都很小,为了达到和正太分布方差相同的目的,必须有一些值离中心点越远,所以这就是所说的“厚尾”,反应的是异常点增多这一现象。

偏度的定义:

image
image

样本X的偏度为样本的三阶标准矩

其中\mu是均值,\delta为标准差,E是均值操作。\mu_3是三阶中心距,\kappa_t t^{th}累积量

偏度可以由三阶原点矩来进行表示:

image
image

样本偏度的计算方法:

一个容量为n的数据,一个典型的偏度计算方法如下:

image
image

其中\bar x为样本的均值(和\mu的区别是,\mu是整体的均值,\bar x为样本的均值)。s是样本的标准差,m_3是样本的3阶中心距。

另外一种定义如下:

image
image

k_3是三阶累积量\kappa_3的唯一对称无偏估计(unique symmetric unbiased estimator)(k_3\kappa_3写法不一样)。k_2=s^2是二阶累积量的对称无偏估计。

大多数软件当中使用G_1来计算skew,如Excel,Minitab,SAS和SPSS。

峰度的定义:

image
image

峰度定义为四阶标准矩,可以看出来和上面偏度的定义非常的像,只不过前者是三阶的。

样本的峰度计算方法:

image
image

样本的峰度还可以这样计算:

image
image

其中k_4是四阶累积量的唯一对称无偏估计,k_2是二阶累积量的无偏估计(等同于样本方差),m_4是样本四阶平均距,m_2是样本二阶平均距。

同样,大多数程序都是采用G_2来计算峰度。

python使用pandas来计算偏度和峰度

代码语言:javascript
复制
import pandas as pd
x = [53, 61, 49, 66, 78, 47]
s = pd.Series(x)
print(s.skew())
print(s.kurt())

它是用上面的G_1来计算偏度 G_2来计算峰度,结果如下:

代码语言:javascript
复制
0.7826325504212567
-0.2631655441038463

参考:

偏度和峰度如何影响您的分布

Skewness 维基百科给出了偏差的计算公式

Kurtosis 维基百科给出峰度的计算公式

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/167123.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 偏度(skewness)和峰度(kurtosis):
  • 偏度的定义:
  • 样本偏度的计算方法:
  • 峰度的定义:
  • 样本的峰度计算方法:
  • python使用pandas来计算偏度和峰度
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档