专栏首页思考是一种快乐5人法则:小样本也有力量

5人法则:小样本也有力量

案例

假如,你想知道你们公司每个员工的通勤时间是多少。而公司员工有上千人,一个一个问太费时。你并不需要得到精确的结果,有没有好的办法呢?

有一个简单的办法:你只需要随机问5个人即可!

假设你得到的答案是:30分钟、50分钟、40分钟、60分钟和45分钟。 这5个数字的最小值为30,最大值为60。那么,你就可以断定:所有员工通勤时间的中间值,有93.75%的可能性在30~60分钟之间。

原理

上面用到的方法叫5人法则。该方法之所以有效,是因为它估计的是群体的中间值。所谓“中间值”(或中位数),就是群体中有一半的值大于它,一半的值小于它。

假如我们随机选的5个都大于或都小于中间值,那么中间值就在30~60的范围之外。这样的情况概率有多大呢?

根据定义,随机算一个值,其大于中间值的概率是50%。这个扔一个硬币,正面朝上的概率是一样的。随机选择5个都大于中间值的概率,等于连续扔5次硬币全部正面朝上的概率。这样的概率是1/32,即3.125%。同样,所有5个都小于中间值的概率也是3.125%。

中间值在5个人范围(30~60)的概率 = 100% - 3.125% - 3.125% = 93.75%

有时候,一个好的测量方法,能够大大节省成本!

相关文章

Elasticsearch全文检索与余弦相似度

推荐引擎算法 - 猜你喜欢的东西

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 卷积神经网络的原理

    在普通神经网络中,每个神经元都和临近层的所有神经元相连接,这称为全连接(full-connected).

    Stanley Sun
  • 自适应学习系列(一)IRT简介

    Zone of Proximal Development(ZPD)是由心理学家Vygotsky提出来的一种学习理论,是目前自适应学习常用的思考模型。他认为,能力...

    Stanley Sun
  • Scrapy 入门教程

    爬虫就是Scrapy用来从网站抓取数据的类,它们都继承于scrapy.Spider类。

    Stanley Sun
  • 【58期】盘点那些面试中最常问的MySQL问题,第一弹!

    因为MyISAM相对简单所以在效率上要优于InnoDB.如果系统读多,写少。对原子性要求低。那么MyISAM最好的选择。且MyISAM恢复速度快。可直接用备份覆...

    良月柒
  • Android-Jetpack笔记-Paging结合网络数据

    上篇文章介绍了paging+room的使用,这篇主要介绍paging+网络数据的使用和原理。

    Holiday
  • SQL学习笔记之B+树

    任意节点,它的左子树如果不为空,那么左子树上所有节点的值都小于根节点的值; 任意节点,他的右子树如果不为空,那么右子树上的所有节点的值大于根节点的值。

    Jetpropelledsnake21
  • 判断监听系统网络状态

    麦克劳林
  • java编写Base64密码器

    Base64加密算法,应用广泛,尤其是在电子邮件传输上,有很大的用途

    张泽旭
  • Java开发 一起来画画(源码)

    用户2965768
  • 震惊了!每30秒学会一个Python小技巧

    向大家推荐一个将碎片化时间利用到极致的github项目《30-seconds-of-python》

    统计学家

扫码关注云+社区

领取腾讯云代金券