前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一蛙之见“贝叶斯”

一蛙之见“贝叶斯”

作者头像
herain
发布2022-04-27 19:20:01
2760
发布2022-04-27 19:20:01
举报
文章被收录于专栏:数据指象

和大多数初学初见者一样,看到“贝叶斯”,脑海里只想到“概率”二字

然而贝叶斯绝对不是简单的“概率”,如何概率能够涵盖“贝叶斯”的哲学深意,先驱大贤何必多此一举?

“太阳东起西落”是必然而然的事;“瓜熟蒂落”同样是无需多疑的事。

明天股票的涨跌,每个人心中却有不同的度量 ;全球经济的形势,每个人心中却有不同的预判

基于已发生事件频次的之上统计计算出的频率是客观概率,客观概率由于客观存在而却是主观能动性的用武之地。贝叶斯讨论的概率是基于个人的主观概念,表达对某事某物的相信程度。概率中就出现了频率学派和贝叶斯学派。

我们很多偏执的分歧来自于不同主观概率的预判,这种主观的预判就是我们常说的先验概率。在股市中吃过甜头的人当然比普通人更相信炒股可以自给自足。不同的经历带来不同磨练形成不同三观,不同的三观对食物的主观自然因人而异了。

化解分歧的办法,不是消除先验概率,而是在新的环境,新的特例去探究学习而不是固守先验自圆其说。在特例的环境中看事物的概率是一种条件概率的表征。过于重视条件概率而忽略先验概率,我们就是缺乏定力而疲于奔命。反之恪守先验,不开放眼界我们常常会墨守成规而刚愎自用。

以先验概率为本,以条件概率为辅,我们才能固本革新;大到国家小到个人同样的道理。

从公式角度解读贝叶斯:

根据前文的描述我们很容易将贝叶斯公式就行拆解:B是先验概率、P(B|A)是条件概率、P(A|B)是后验概率。大家肯定困惑贝叶斯公式多余部分,下面会解答。

还是从简单的抛硬币开始,我们知道抛硬币硬币是一个二元的事件组:(正面朝上、反面朝上)。我们知道正面朝上的可能性是0.5,但是事件的概率取值是[0,1]。

所以在抛硬币之前,先验概率B在[0,1]。

假设小王认为先验的概率B是0.5,那么抛10次硬币,m次正面的概率是:

顺便普及一下组合公式:10次事件m次正面朝上的情况

通过Excel中BINOMDIST(5,10,先验概率,0)函数,我么可以快速求出m=5是的概率。当我们的先验概率越接近可能性0.5时候,我们可以得到最大的概率。

其实上图刻画的是先验概率的概率,如果我们做归一化处理,让积分面积为1,就能转化成一个概率分布。

(归一化后的概率分布函数)

(常数项可以消除)

如果我们将:

是不是将等价于我们熟悉的beta分布了?

到这里我们明朗了,贝叶斯的底层逻辑是概率beta分布。beta分布是会基于先验概率,来汲取新案例去调整输出概率值的。

这里我们可以做一组R实验:

如果抛硬币的先验概率为0.5,比如:10次抛硬币会出现5次正面5次反面。

当正面朝上的正面不断增加,反面朝上的次数不变时。

随着正面次数不断的5、15、25、35、45、55、65、75、85增多少,我们是否可以怀疑自己的先验概率呢?因为当正面朝上案例增多,后验概率不断的突破0.5逼近1。

根据大数据定律我们有信心怀疑硬币有问题而否定运气的成分,从而我们才能避免先验概率带来的后果。如果后有概率是1,我相信我们不会再去尝试赌博了,因为这里肯定有猫腻。

代码语言:javascript
复制
> k=seq(5,100,10)
> par(mfrow=c(3,3),mai=c(0.6,0.5,0.2,0.1))
> for(i in 1:9)
> curve(dbeta(x, k[i], 5), xlim = c(0,1), ylim=c(0,20),ylab="T",main=substitute(Beta(b,10),list(b=k[i])),col="lightblue")

贝叶斯让我辩证的去看到概率,不要迷恋书本知识,也要在实践中捕捉新的特例来弥补先验概率的不足,这样我们才能走的越稳。稳住,我们能赢!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据指象 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档