在我目前学到的概率论中,有两个相当重要的公式——全概率公式和贝叶斯公式,但是很多同学可能对这两个公式感到非常迷茫。一是不知道公式背后的意义所在,二是不知道这些公式有什么现实应用。
一、全概率公式
在讲全概率公式之前,首先要理解一个概念“完备事件组”.
我们将满足 $B_iB_j = \emptyset (i≠j)$,$B_1 + B_2 +… = Ω$,这样的一组事件称为一个“完备事件组”。简言之,所有的事件两两互斥,所有事件的并集是整个样本空间.
假设我们要研究事件$A$,我们希望能够求出$P(A)$,但是经过一番探索,却发现$P(A)$本身很难直接求出,不过却能够比较容易地求出各个$P(B_i)$,以及相应的条件概率$P(A|B_i)$。我们现在希望通过这些信息,间接的求出$P(A)$.
这当然可以,别忘了$B_i$是两两互斥的,即$A = AΩ = AB_1 + AB_2 + …$,显然,$AB_1,AB_2,AB_3,…$也是两两互斥的,那么上述式子就可以加上概率符号变为:$P(A) = P(AΩ) = P(AB_1 + AB_2 + …) = A(AB_1)+P(AB_2)+P(AB_3)+…$,我们看每一项$ \sum_{i = 1}^n P(AB_i)$其实利用概率的乘法公式,不就可以变为了$\sum_{i = 1}^n P(B_i)P(A|B_i)$吗,最终我们就推导出了全概率公式:
用图表示可能更好理解,$P(A)$本身并不好求,但我们可以根据他散落的“碎片”间接地将其求出。但不是所有的情况都能这样求出——必须保证$B_1,B_2,…$是一个完备事件组。这个其实很好理解,假如你想将一个碎掉的花瓶重新还原,碎片不全或者碎片之间出现了多余的“重叠”,还原工作都将以失败告终.
下面我们来看一个比较经典的例题.
某地盗窃风气盛行,且盗窃者屡教不改,我们根据以往的案件记录,推断出A今晚作案的概率是0.8,B今晚作案的概率是0.1,C今晚作案的概率是0.5,除此之外,还推断出A的得手率是0.1,B的得手率是1.0,C的得手率是0.5.那么今晚有东西被偷的概率是多少?
题目我们已经知道了,但是如何下手呢?我在上一篇文章中说到了,先“设事件”,不论怎么样,先把事件设出来,这样条理比较清楚.
设:$A:A$今晚作案;$B:B$今晚作案;$C:C$今晚作案;$S:$今晚有东西被偷
则:$P(A) = 0.8,P(B) = 0.1,P(C) = 0.5$
$P(S|A) = 0.1,P(S|B) = 0.7,P(S|C) = 0.2$
那么所求的$P(S) = P(A)P(S|A) + P(B)P(S|B) + P(C)P(S|C) = 0.25$
看来今晚被偷的可能性比较小.
二、贝叶斯公式
有了前面的基础,我们现在先直接给出贝叶斯公式:
这个公式本身平平无奇,无非就是条件概率的定义加上全概率公式一起做出的一个推导而已(分子由乘法公式推出,分母由全概率公式推出)。但它所表达的意义却非常深刻.
在全概率公式中,如果将$A$看成是“结果”,$B_i$看成是导致结果发生的诸多“原因”之一,那么全概率公式就是一个“原因推结果”的过程。但贝叶斯公式恰恰相反。贝叶斯公式中我们知道$A$已经发生了,所要做的是反过来研究造成结果发生的原因,该原因造成的可能性有多大,即“结果推原因”
举个例子:
假设某种病菌在人口中的带菌率为0.03,由于技术落后等等原因,使得带菌者有时未被检测出阳性反应,不带菌者也可能会被检测出阳性反应。有如下数据:
$A:$这个人带菌,$B:$检测结果为阳性.
$P(B|A) = 0.99$,$P(\bar B|A) = 0.01$,$P(B|\bar A) = 0.05$,$P(\bar B|\bar A) = 0.95$
结果竟然连40%都没有,问题出在哪里?我们没有注意到,带菌率低到只有0.03,甚至比误检率还要低。也就是说,在一大批人里可以检查出一堆阳性的,而这堆阳性的人里面真正带菌的,也只是一小部分而已.
总结一下
全概率公式和贝叶斯公式是正好相反的两个求概率的公式
全概率公式用于求最后的结果概率,贝叶斯公式应用于已知最后结果,求原因的概率.
建议在做题的时候,如果遇到贝叶斯公式的问题,先把完备事件组画在旁边.