贝叶斯分析作为一个统计学的基本流派,对机器学习及各种用概率决策的领域具有重大影响,甚至作为理解人类智能的一种基本框架。总的来讲,贝叶斯定律通过先验和条件概率的结合,可以综合已有过往人类对一个领域的知识和更新的数据,来不停改进人类的认知。简单说就是,某人的行为会不断修正其他人对他的看法,贝叶斯不仅是一种方法论,更是一种世界观.
我对贝叶斯公式最深的感触还是在书上的一道例题——“狼来了”
《伊索寓言》中有一则“孩子与狼”的故事,讲的是一个小孩每天到山上放羊,山里有狼出没.第一天,他在山上喊“狼来了!狼来了!”,山下的村民闻声便去打狼,可到了山上,发现狼没有来;第二天也如此;第三天,狼真的来了,可无论小孩怎么喊叫,也没有人来救他,因为前两天他说了慌,人们不再相信他了.试用贝叶斯公式来分析此寓言中村民对这个小孩的可信度是如何下降的.
题目如上,下面我们开始分析.这题分两个方面,一是小孩,二是村民.
小孩有两种行为:一是说谎,二是不说谎.
村民有两种行为:一是认为小孩可信,二是认为小孩不可信.
类似的问题都是先设事件:$A:$小孩说谎,$B:$小孩可信
不妨设过去村民对这个小孩的印象是$P(B) = 0.8,P(\bar B) = 0.2$,用贝叶斯公式计算村民对这个小孩的可信程度的改变时要用到$P(A|B),P(A|\bar B)$,即“可信的孩子说谎”的概率与“不可信的孩子说谎”的概率,在此不妨设$P(A|B)= 0.1$,$P(A|\bar B) = 0.5$.
第一次村民上山打狼,发现狼没有来,即小孩说了谎,村民根据这个信息,将这个小孩的可信程度改变为:
这表明村民上了一次当后,对这个小孩可信程度由原来的0.8调整为0.444,也就是将村民对这个小孩的最初印象$P(B) = 0.8,P(\bar B) = 0.2$调整为$P(B) = 0.444,P(\bar B) = 0.556$.
在这个基础上,我们再用贝叶斯公式计算$P(B|A)$,即这个小孩第二次说谎之后,村民认为他的可信程度改变为:
这表明村民经过两次上当后,对这个小孩的信任程度已经由最初的0.8下降到了0.138,如此低的可信度,村民听到第三次呼叫时,怎么再会上山去打狼呢?
这个例子对人来说有很大的启发,“某人的行为会不断修正其他人对他的看法”,这话也是我们老师上课时候说的一句话,我觉得很应景,也很经典.