所谓的泊松分布(请参阅http://en.wikipedia.org/…)由SiméonPoisson于1837年进行了介绍。亚伯拉罕·德·莫伊夫(Abraham De Moivre)于1711年在De Mensura Sortis seu对其进行了定义。
如果考虑大量观察值,并且计算给定(小)区域中有多少观察值,则此类观察值的数量就是泊松分布。
n=1000
polygon(c(u,rev(u)),c(v,rev(-v)),col="yellow",border=NA)
I=(X^2+Y^2)<1
points(X[I],Y[I],cex=.6,pch=19,col="red")
如果我们进行一些模拟
> n=1000
> ns=100000
> N=rep(NA,ns)
>
+
+
+
+
+
>
> mean(N)
[1] 31.41257
泊松分布的参数是黄色圆盘的面积,即正方形的面积,即
> lines(0:60-.5,dpois(0:60,lambda),type="b",col="red")
如上所述,当事件以某种方式随机且独立地随时间发生时,就会出现泊松分布。然后很自然地研究两次事件之间的时间(或在保险范围内两次索赔)。
既不是SiméonPoisson也不是De Moivre,而是Ladislaus Von Bortkiewicz首先提到了Poisson分布是小数定律。1898年,他研究了1875年至1894年间被马踢倒杀死的士兵的人数,其中有200个兵团。
他确实获得了以下分布(此处,泊松分布的参数为0.61,即每年的平均死亡人数)
在很多情况下,泊松分布都非常适合。例如,如果我们考虑1850年后在佛罗里达州的飓风数量,
返回期是由Emil Gumbel在水文学中介绍的,用于链接概率和持续时间。十年事件的发生概率为1/10。那么10是发生之前的平均等待时间。这并不意味着该事件不会在10年之前发生,或者必须在10年之前发生,通常用下表来总结此属性,
上表中的对角线非常有趣。似乎在某种程度上趋向极限值(此处为63.2%)。在n年内观察到的事件数量具有二项式分布。那么,没有灾难的概率为0.632。
计算稀有事件的概率时,泊松分布不断出现。例如,在50年的时间里,至少有一次在核电厂发生事故的可能性。假设在反应堆中发生事故的年概率
很小,例如0.05%。
进一步假设反应堆在时间上相互独立。
>
>
[1] 0.1812733
>
[1] 0.1812692
这是具有参数为的泊松分布时为零 的概率 。
解决这个问题的另一种方法是基于以下思想:鉴于在对全球450座反应堆进行的45年观察中(,观察到了三起重大事故,包括“三哩岛”(1979年)和“福岛”(2011年),即两次事故之间的平均时间估计为16年。对于单个反应堆,我们可以假设事件发生之前等待的平均时间是16年的450倍,即7200年。或者,一个反应堆在一年内发生一次事件的概率是7200以上的事件之一(这是“返还期”概念背后的想法)。如果我们假设事故的到来是随机且彼此独立发生的(如上定义),则在50年内观察到的重大事故数量遵循参数为50 /(7200/80)的泊松分布。
即
>
[1] 0.4262466