记一道贝叶斯公式的裸题

上课好不容易听懂了,赶紧整理一下,不然以我的记性估计明天就要忘干净了

题目

一个用户所有邮件分为两类:$A_1$代表垃圾邮件, $A_2$代表非垃圾邮件

根据经验,$P(A_1) = 0.7$, $P(A_2) = 0.3$。

令$B$表示邮件包含“免费”这一关键词,由历史邮件得知, $P(B|A_1) = 0.9$,

$P(B|A_2) = 0.01$(注意:它们之和并不一定等于$1$)。

问若收到一封新邮件,包含了“免费”这一关键字,那么它是垃圾邮件的概率是多少

Solution

题目要求的实际是$P(A_1|B)$

根据条件概率公式

$$P(A_1|B)=\frac{P(A_1|B)}{P(B)}$$

转换为贝叶斯公式

$$P(A_1|B)=\frac{P(B|A_1)P(A_1)}{P(B)}$$

将分式底下$P(B)$这一项用全概率公式展开

$$P(A_1|B)=\frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1)+P(B|A_2)P(A_2)}$$

然后就可以算了

$$P(A_1|B)=\frac{0.9*0.7}{0.9*0.7+0.01*0.3}$$

$$\approx 0.995260663507109004739336492891 \% $$

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏目标检测和深度学习

牛人教你高效读论文

16020
来自专栏数据和云

嘉年华专访 | 国际上智能运维研究

张圣林,南开大学助理教授,于2017年7月获清华大学工学博士学位(计算机科学与技术专业)并获得清华大学优秀博士学位论文,导师是刘莹老师和裴丹老师。

52230
来自专栏人工智能

机器学习并不难

在这篇文章中,我们将讨论一般情况下的机器学习的方法以及其与数据库之间的交互途径。如果你是一个不知从何开始学起的初学者,有兴趣知道到底为何我们需要机器学习,并且疑...

24890
来自专栏PPV课数据科学社区

21个必知的数据科学面试题及答案

Q1.解释什么是正则化,以及它为什么有用。 回答者:Matthew Mayo 正则化是给模型添加一个调优参数的过程,来引导平滑以防止过拟合。(参考KDnugge...

37870
来自专栏机器人网

三种人工智能开源框架

TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流...

21410
来自专栏新智元

Jeff Dean、李飞飞等发起SysML大会,Jeff Dean主题演讲:系统与机器学习融合(45PPT)

新智元报道 来源:SysML 2018 编辑:闻菲、艾霄葆、常佩琦、刘小芹 【新智元导读】Jeff Dean、Michael I.Jordan、李飞飞、...

44380
来自专栏灯塔大数据

每周学点大数据 | No.52众包算法例析

NO.52 众包算法例析 小可:讨论了这么多,我还是想通过一个具体的众包例子来了解一下众包算法。 Mr. 王:好,我们就从计算机的角度用具体的例子来分析一下众...

36470
来自专栏大数据挖掘DT机器学习

想做数据分析师,该如何学习?

? 作者:Chiffon 来源:七风阁 http://chiffon.gitcafe.io/2015/01/10/MLE.html 经常有人问我怎么才能成一...

40570
来自专栏xingoo, 一个梦想做发明家的程序员

白话推荐系统——从原理到实践,还有福利赠送!

之前流水账似的介绍过一篇机器学习入门的文章,大致介绍了如何学习以及机器学习的入门方法并提供了一些博主自己整理的比较有用的资源。这篇就尽量以白话解释并介绍机器学...

22160
来自专栏大数据挖掘DT机器学习

如何将机器学习技术应用到文本挖掘中

本挖掘典型地运用了机器学习技术,例如聚类,分类,关联规则,和预测建模。这些技术揭示潜在内容中的意义和关系。文本发掘应用于诸如竞争情报,生命科学,客户呼声,媒体...

43660

扫码关注云+社区

领取腾讯云代金券