我有一个数据集,其中包含了我们工作的所有提供者的招生率。我需要将这些数据划分为四分位数,以便每个提供程序能够看到它们与其他提供者相比的速率。比率由7%至89%不等。有人能建议我怎么做吗?我不知道这里是否适合提出这个问题,但如果有人能在这方面帮助我,我将非常感激。
另一个问题是,如果提供者的数字真的很小,例如: 2/4 = 50%,那么提供者可能会陷入更糟糕的四分位数,但这并不意味着提供者的性能很差,因为数字太小了。我希望这是有意义的。如果我能进一步澄清的话,请告诉我。
发布于 2013-07-16 12:44:37
首先要注意的是:对于小n,不要使用四分位数。N是否小是任意的。
发布于 2013-07-16 12:46:31
有一些方法可以在不进行完整排序的情况下获得分位数,但是除非您有大量的数据,否则如果您还没有得到这些算法,那么实现这些算法就没有意义了。假设您有一个可用的sort()
函数,您所需要做的就是:
n/4
、n/2
和3*n/4
第四点,这是四分位数。正如您所说的,如果n小于某个数字(您必须自己决定),您可能想说四分位数的结果“不适用”或诸如此类。
https://stackoverflow.com/questions/17686298
复制相似问题