专栏首页我是攻城师统计学里面的百分位数是什么意思

统计学里面的百分位数是什么意思

百分位数是一个统计学里面的概念,原来在review的elasticsearch中文文档聚合的章节里面遇到过,一直没搞明白什么意思,后来在jmeter里面又看到了这个术语,所以觉得有必要补充了解一下这个知识,下面的这个文章是网上不错的一篇文章比较通俗的通过例子解释了百分位数的含义,原文如下:

jmeter里面90% Line 参数正确的含义:

虽然,我的上面理解有一定的道理,显然它是错误的。那看看JMeter 官网是怎么说的?

90% Line - 90% of the samples took no more than this time. The remaining samples at least as long as this.

“ 90% 的样品没有超过这个时间,剩余的样品至少只要这个。”(拿google翻译的)

没太理解是什么意思,于是,点击详细解释。

90% Line (90 th Percentile) is the value below which 90% of the samples fall. The remaining samples too at least as long as the value. This is a standard statistical measure. See, for example: Percentile entry at Wikipedia.

英语太差,还是没理解到底啥意思,不过最后提示我,用维基百科查一下什么是百分位数。

百分位数:

统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。 中位数是第50百分位数。 第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。 第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。 高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。

其实,也就是最后这个考生分数的例子,让我豁然明白了。

假如:

有10个数:

1、2、3、4、5、6、7、8、9、10 按由大到小将其排列。

求它的第90%百分位,也就是第9个数刚好是9 ,那么他的90%Line 就是9 。

另一组数:

2、2.1、2.5、3、3.4、3.4、4、4、4、4、5、5、5、5.9、5.91、6.8、8、12、24、24.1 按由大到小将其排列。

求它的第90%百分位,第18个数是12 么,他的90%Line 就是12。

再来解释90%Line

一组数由小到大进行排列,找到他的第90%个数(假如是12),那么这个数组中有90%的数将小于等于12 。

用在性能测试的响应时间也将非常有意义,也就是90%用户响应时间不会超过12 秒。

本文分享自微信公众号 - 我是攻城师(woshigcs),作者:散仙

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-12-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 使用shell分页读取600万+的MySQL数据脚本

    我是攻城师
  • 使用Scala的强大api快速加工数据

    我是攻城师
  • ElasticSearch入门之风花雪月(五)

    我是攻城师
  • JMeter专题系列(七)聚合报告之 90% Line

    90% Line - 90% of the samples took no more than this time. The remaining samples...

    流柯
  • P6Spy & SQL Profiler & IronTrack SQL

    “Nearly 80 to 85 percent of database performance problems arise from the ap...

    阿敏总司令
  • 记武汉2016年第一期学习力提升工作坊——MVP效果总结篇工作坊结束效果:

    在《改造我们的学习——记武汉2016年第一期学习力提升工作坊——POC验证实验篇》中,我介绍了”学习力提升工作坊”这个POC的实验情况。经过四周的实验,工作坊最...

    顾宇
  • jQuery 操作 JSON 对象 修改 ztree 结构

    ztree 引用了系统中 部门试图的数据集结果,存储为一个 json 对象。其中,通过每个数据的 ParentId 来对应关联树状结构。

    李郑
  • FW:面向方面开发

       面向对象技术很好地解决了软件系统中角色划分的问题。借助于面向对象的分析、设计和实现技术,开发者可以将问题领域的“名词”转换成软件系统中的对象,从而很自然地...

    阿敏总司令
  • 面试Mybatis之对象工厂和拦截器

    这节我们讲两个关于Mybatsi常用知识点,欢迎持续关注,洁癖会推出一系类相关Mybatis面试以及经常在工作中使用的知识点,废话不多说,来开始我们的讲解吧!

    小土豆Yuki
  • 对Python中装饰器(Decorator)

      有时候我们项目中的某些功能做些修改即需要对内部的某些函数添加一些附加功能,但是为了安全起见不想改变函数的源代码以及函数的调用方式,那么装饰器在这个地方会给我...

    py3study

扫码关注云+社区

领取腾讯云代金券