全概率公式和贝叶斯公式

在我目前学到的概率论中,有两个相当重要的公式——全概率公式和贝叶斯公式,但是很多同学可能对这两个公式感到非常迷茫。一是不知道公式背后的意义所在,二是不知道这些公式有什么现实应用。

一、全概率公式

在讲全概率公式之前,首先要理解一个概念“完备事件组”.

我们将满足 $B_iB_j = \emptyset (i≠j)$,$B_1 + B_2 +… = Ω$,这样的一组事件称为一个“完备事件组”。简言之,所有的事件两两互斥,所有事件的并集是整个样本空间.

假设我们要研究事件$A$,我们希望能够求出$P(A)$,但是经过一番探索,却发现$P(A)$本身很难直接求出,不过却能够比较容易地求出各个$P(B_i)$,以及相应的条件概率$P(A|B_i)$。我们现在希望通过这些信息,间接的求出$P(A)$.

这当然可以,别忘了$B_i$是两两互斥的,即$A = AΩ = AB_1 + AB_2 + …$,显然,$AB_1,AB_2,AB_3,…$也是两两互斥的,那么上述式子就可以加上概率符号变为:$P(A) = P(AΩ) = P(AB_1 + AB_2 + …) = A(AB_1)+P(AB_2)+P(AB_3)+…$,我们看每一项$ \sum_{i = 1}^n P(AB_i)$其实利用概率的乘法公式,不就可以变为了$\sum_{i = 1}^n P(B_i)P(A|B_i)$吗,最终我们就推导出了全概率公式:

用图表示可能更好理解,$P(A)$本身并不好求,但我们可以根据他散落的“碎片”间接地将其求出。但不是所有的情况都能这样求出——必须保证$B_1,B_2,…$是一个完备事件组。这个其实很好理解,假如你想将一个碎掉的花瓶重新还原,碎片不全或者碎片之间出现了多余的“重叠”,还原工作都将以失败告终.

下面我们来看一个比较经典的例题.

某地盗窃风气盛行,且盗窃者屡教不改,我们根据以往的案件记录,推断出A今晚作案的概率是0.8,B今晚作案的概率是0.1,C今晚作案的概率是0.5,除此之外,还推断出A的得手率是0.1,B的得手率是1.0,C的得手率是0.5.那么今晚有东西被偷的概率是多少?

题目我们已经知道了,但是如何下手呢?我在上一篇文章中说到了,先“设事件”,不论怎么样,先把事件设出来,这样条理比较清楚.

设:$A:A$今晚作案;$B:B$今晚作案;$C:C$今晚作案;$S:$今晚有东西被偷

则:$P(A) = 0.8,P(B) = 0.1,P(C) = 0.5$

$P(S|A) = 0.1,P(S|B) = 0.7,P(S|C) = 0.2$

那么所求的$P(S) = P(A)P(S|A) + P(B)P(S|B) + P(C)P(S|C) = 0.25$

看来今晚被偷的可能性比较小.

二、贝叶斯公式

有了前面的基础,我们现在先直接给出贝叶斯公式:

这个公式本身平平无奇,无非就是条件概率的定义加上全概率公式一起做出的一个推导而已(分子由乘法公式推出,分母由全概率公式推出)。但它所表达的意义却非常深刻.

在全概率公式中,如果将$A$看成是“结果”,$B_i$看成是导致结果发生的诸多“原因”之一,那么全概率公式就是一个“原因推结果”的过程。但贝叶斯公式恰恰相反。贝叶斯公式中我们知道$A$已经发生了,所要做的是反过来研究造成结果发生的原因,该原因造成的可能性有多大,即“结果推原因”

举个例子:

假设某种病菌在人口中的带菌率为0.03,由于技术落后等等原因,使得带菌者有时未被检测出阳性反应,不带菌者也可能会被检测出阳性反应。有如下数据:

    $A:$这个人带菌,$B:$检测结果为阳性.

$P(B|A) = 0.99$,$P(\bar B|A) = 0.01$,$P(B|\bar A) = 0.05$,$P(\bar B|\bar A) = 0.95$

结果竟然连40%都没有,问题出在哪里?我们没有注意到,带菌率低到只有0.03,甚至比误检率还要低。也就是说,在一大批人里可以检查出一堆阳性的,而这堆阳性的人里面真正带菌的,也只是一小部分而已.

总结一下

全概率公式和贝叶斯公式是正好相反的两个求概率的公式

全概率公式用于求最后的结果概率,贝叶斯公式应用于已知最后结果,求原因的概率.

建议在做题的时候,如果遇到贝叶斯公式的问题,先把完备事件组画在旁边.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Python中文社区

Kaggle HousePrice 特征工程部分之统计检验

專 欄 ❈ 王勇,Python中文社区专栏作者,目前感兴趣项目为商业分析、Python、机器学习、Kaggle。17年项目管理,通信业干了11年项目经理管合同...

27710
来自专栏深度学习思考者

图像处理——目标检测与前背景分离

前提     运动目标的检测是计算机图像处理与图像理解领域里一个重要课题,在机器人导航、智能监控、医学图像分析、视频图像编码及传输等领域有着广泛的应用。 ...

35111
来自专栏人工智能LeadAI

通俗易懂丨深度学习如何入门

? 作者:Jacky Yang(知乎) 关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。 这里有几个原因: 1.深度学习确实需要一定的数学基础...

29610
来自专栏AI研习社

深度学习如何入门?

关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。 这里有几个原因: 1. 深度学习确实需要一定的数学基础。如果不用深入浅出地方法讲,有些读者就会有...

3036
来自专栏专知

如何用机器学习处理二元分类任务?

图像是猫还是狗?情感是正还是负?贷还是不贷?这些问题,该如何使用合适的机器学习模型来解决呢?

1243
来自专栏AI科技大本营的专栏

机器如何学习?5分钟弄懂监督学习、无监督学习、半监督学习与强化学习

导读:不知道你有没有这样的感受,想学点人工智能,却被一大堆名词吓坏? 想看点直白的说人话的简单介绍,却被各种绕来绕去的语言弄昏头? 没关系,本文就试图以最简单的...

3727
来自专栏刁寿钧的专栏

10分钟梳理机器学习基础知识(一)——在意的小问题

每天10分钟,用去食堂吃饭的时间解决一个知识点。

2580
来自专栏机器之心

业界 | 谷歌官方揭秘AutoDraw人工智能绘画工具原理:让机器学会理解艺术

选自GoogleBlog 作者:David Ha 机器之心编译 参与:黄小天、李泽南、李亚洲 谷歌 4 月 11 日推出的 AutoDraw 是一个应用人工智能...

3618
来自专栏Petrichor的专栏

深度学习: Zero-shot Learning / One-shot Learning / Few-shot Learning

在 迁移学习 中,由于传统深度学习的 学习能力弱,往往需要 海量数据 和 反复训练 才能修得 泛化神功 。为了 “多快好省” 地通往炼丹之路,炼丹师们开始研究 ...

663
来自专栏玉树芝兰

如何用机器学习处理二元分类任务?

图像是猫还是狗?情感是正还是负?贷还是不贷?这些问题,该如何使用合适的机器学习模型来解决呢?

732

扫码关注云+社区