统计学里面的百分位数是什么意思

百分位数是一个统计学里面的概念,原来在review的elasticsearch中文文档聚合的章节里面遇到过,一直没搞明白什么意思,后来在jmeter里面又看到了这个术语,所以觉得有必要补充了解一下这个知识,下面的这个文章是网上不错的一篇文章比较通俗的通过例子解释了百分位数的含义,原文如下:

jmeter里面90% Line 参数正确的含义:

虽然,我的上面理解有一定的道理,显然它是错误的。那看看JMeter 官网是怎么说的?

90% Line - 90% of the samples took no more than this time. The remaining samples at least as long as this.

“ 90% 的样品没有超过这个时间,剩余的样品至少只要这个。”(拿google翻译的)

没太理解是什么意思,于是,点击详细解释。

90% Line (90 th Percentile) is the value below which 90% of the samples fall. The remaining samples too at least as long as the value. This is a standard statistical measure. See, for example: Percentile entry at Wikipedia.

英语太差,还是没理解到底啥意思,不过最后提示我,用维基百科查一下什么是百分位数。

百分位数:

统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。 中位数是第50百分位数。 第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。 第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。 高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。

其实,也就是最后这个考生分数的例子,让我豁然明白了。

假如:

有10个数:

1、2、3、4、5、6、7、8、9、10 按由大到小将其排列。

求它的第90%百分位,也就是第9个数刚好是9 ,那么他的90%Line 就是9 。

另一组数:

2、2.1、2.5、3、3.4、3.4、4、4、4、4、5、5、5、5.9、5.91、6.8、8、12、24、24.1 按由大到小将其排列。

求它的第90%百分位,第18个数是12 么,他的90%Line 就是12。

再来解释90%Line

一组数由小到大进行排列,找到他的第90%个数(假如是12),那么这个数组中有90%的数将小于等于12 。

用在性能测试的响应时间也将非常有意义,也就是90%用户响应时间不会超过12 秒。

原文发布于微信公众号 - 我是攻城师(woshigcs)

原文发表时间:2016-12-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏杨光的专栏

千亿关系链下的新增共同好友计算

本文介绍一种千亿关系链下的日新增共同好友挖掘算法 --NTE 算法。该算法基于分治的思想,将新增共好友计算问题,转换为更易于运算与实现的三角形计算问题。

9950
来自专栏好好学java的技术栈

“365算法每日学计划”:01打卡

如果有小伙伴很少接触到这种题目的话,可能会觉得有点陌生,不知道从何下手,可能一开始我们能想到“最笨”的方法,但是也觉得挺有“娱乐性”的方法。

2803
来自专栏老九学堂

技术大咖分享:如何评价一段代码?

经常有人微信问老九君,什么样的代码才算是好代码。这个问题其实见仁见智,业内也没有统一的标准可以使用。我仔细梳理了一下自己评价代码的方法,总结了五个评价指标。 规...

3676
来自专栏芋道源码1024

算法与面试之-如何准备算法面试

初始序列为1 8 6 2 5 4 7 3的一组数采用堆排序,当建堆(小根堆)完毕时,堆所对应的二叉树中序遍历序列为:( )

2083
来自专栏流柯技术学院

JMeter专题系列(七)聚合报告之 90% Line

90% Line - 90% of the samples took no more than this time. The remaining samples...

2134
来自专栏包子铺里聊IT

解锁 Leetcode 新题:寻找明星

Suppose you are at a party with n people (labeled from 0 to n - 1) and among the...

3776
来自专栏ThoughtWorks

像机器一样思考|TW洞见

今日洞见 文章作者、部分图片来自ThoughtWorks:仝键。 本文所有内容,包括文字、图片和音视频资料,版权均属ThoughtWorks公司所有,任何媒体、...

3747
来自专栏数据派THU

放弃“for循环”,教你用这种算法 !(附代码)

原文标题:Why you should forget ‘for-loop’ for data science code and embrace vectoriz...

2576
来自专栏程序人生

抽象的能力

人类的智商从低幼逐渐走向成熟的标志之一就是认识和运用数字的能力。当我们三四岁的时候,数数虽然能够熟练地对一百以内的数字随心所欲地倒背如流,但数字对孩童时代的我们...

3457
来自专栏非著名程序员

如何评价一段代码

经常有人微信问我,什么样的代码才算是好代码。这个问题其实见仁见智,业内也没有统一的标准可以使用。我仔细梳理了一下自己评价代码的方法,总结了五个评价指标。 1、规...

1799

扫码关注云+社区

领取腾讯云代金券