前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >李航《统计学习方法》笔记之朴素贝叶斯法

李航《统计学习方法》笔记之朴素贝叶斯法

作者头像
timerring
发布2022-09-21 17:55:16
2890
发布2022-09-21 17:55:16
举报
文章被收录于专栏:TechBlogTechBlog
image-20220728223504454
image-20220728223504454

第4章朴素贝叶斯法

朴素是整个算法的强假设,即变量之间是强相互独立的。

例子

路人拿出来3颗豆,两颗红豆1颗绿豆,我和路人各自抽了一颗,路人发现自己抽中的是绿豆,他想用剩下的那颗和我换,我换不换?换不换豆,抽中红豆概率一样吗?

P(A \mid B)

表示在B发生的条件下发生A的概率。

P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(B \mid A) P(A)}{P(B)}

设A表示我抽中的是红豆,B表示路人抽中的是绿豆

P(A \mid B)=\frac{P(B \mid A) P(A)}{P(B)}=\frac{1 \cdot \frac{1}{3}}{1}=\frac{1}{3}

注意这里的一个误区,由于是在已知B抽中的是绿豆的前提下,因此,这里

P(B)=1

而不是

\frac{2}{3}

结论:如果要红豆,最好和路人交换一下。如果要绿豆,最好不要换。

假设有一个手写数据集,里面有100条记录,其中第0-9条记录是10个人分别写的0。10-19条是10个人分别写的1。……。第90-99条是10个人分别写的10,写了一个数字X,怎么判断是数字几呢? 朴素贝叶斯工作原理:

P(Y=0 \mid X)=?, P(Y=1 \mid X)=?, \cdots \cdots, P(Y=10 \mid X)=?

找到概率值最高的,就是对应的数字。

数学表达就是:

对于刚刚的手写数据集, 我们设数字的类别为 C_{k}, C_{0} 表示数字 0, \cdots \cdots 。刚才数字判别公式可以修改为

\begin{aligned} P\left(Y=C_{\mathrm{k}} \mid X=x\right)=& \frac{P\left(X=x \mid Y=C_{k}\right) P\left(Y=C_{k}\right)}{P(X=x)} \\ =& \frac{P\left(X=x \mid Y=C_{k}\right) P\left(Y=C_{k}\right)}{\sum_{k} P\left(X=x, Y=C_{k}\right)} \\ =& \frac{P\left(X=x \mid Y=C_{k}\right) P\left(Y=C_{k}\right)}{\sum_{k} P\left(X=x \mid Y=C_{k}\right) P\left(Y=C_{k}\right)} \end{aligned}

并且由于每一张图片是8x8的像素点组成,可以看作一个一维64数组,这里是把样本X拆开

\begin{aligned} \mathrm{P}\left(X=x \mid Y=C_{k}\right) &=P\left(X^{(1)}=x^{(1)} \mid Y=C_{k}\right) P\left(X^{(2)}=x^{(2)} \mid Y=C_{k}\right) \cdots P\left(X^{(j)}=x^{(j)} \mid Y=C_{k}\right) \\ &=\prod_{j} P\left(X^{(j)}=x^{(j)} \mid Y=C_{k}\right) \end{aligned}

因此上式可以化简为:

KaTeX parse error: Expected 'EOF', got '&' at position 45: …d X = x\right) &̲ = \frac{P\left…

\begin{aligned} f(x)=\underset{C_{k}}{\operatorname{argmax}} P\left(Y=C_{k} \mid X=x\right) &=\frac{P\left(Y=C_{k}\right) \prod_{j} P\left(X^{(j)}=x^{(j)} \mid Y=C_{k}\right)}{\sum_{k} P\left(Y=C_{k}\right) \prod_{j} P\left(X^{(j)}=x^{(j)} \mid Y=C_{k}\right)} \\ &=P\left(Y=C_{k}\right) \prod_{j} P\left(X^{(j)}=x^{(j)} \mid Y=C_{k}\right) \end{aligned}

其中

\underset{C_{k}}{\operatorname{argmax}}

意味找到让后面这个概率最大的

C_{k}

,其中:

\begin{array}{l} \sum_{k} \prod_{j} p\left(X^{(j)}=x^{(j)} \mid Y=C_k) p(Y=C_k)\right. \\ =\sum_{k } \sum_{j} p\left(X^{(j)}=x^{(j)}, Y=C_{k}\right)=\sum_{j} P\left(X^{(j)}=x^{(j)}\right) \\ =P(X=x) \end{array}

朴素贝叶斯法的参数估计

极大似然估计

在朴素贝叶斯法中, 学习意味着估计

P\left(Y=c_{k}\right)

P\left(X^{(j)}=x^{(j)} \mid Y=c_{k}\right)

。可以 应用极大似然估计法估计相应的概率。先验概率

P\left(Y=c_{k}\right)

的极大似然估计是

P\left(Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)}{N}, \quad k=1,2, \cdots, K

设第 j 个特征 x^{(j)} 可能取值的集合为

条件概率

的极大似然估计是

\begin{array}{l} P\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=\frac{\sum_{i=1}^{N} I\left(x_{i}^{(j)}=a_{j l}, y_{i}=c_{k}\right)}{\sum_{i=1}^{N} I\left(y_{i}=c_{k}\right)} \\ j=1,2, \cdots, n ; \quad l=1,2, \cdots, S_{j} ; \quad k=1,2, \cdots, K \end{array}

式中,

x_{i}^{(j)}

是第 i 个样本的第 j 个特征;

a_{j l}

是第 j 个特征可能取的第 l 个值;

I

为指 示函数。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-07-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第4章朴素贝叶斯法
    • 例子
      • 朴素贝叶斯法的参数估计
        • 极大似然估计
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档