第4章朴素贝叶斯法
朴素是整个算法的强假设,即变量之间是强相互独立的。
例子
路人拿出来3颗豆,两颗红豆1颗绿豆,我和路人各自抽了一颗,路人发现自己抽中的是绿豆,他想用剩下的那颗和我换,我换不换?换不换豆,抽中红豆概率一样吗?
表示在B发生的条件下发生A的概率。
设A表示我抽中的是红豆,B表示路人抽中的是绿豆
注意这里的一个误区,由于是在已知B抽中的是绿豆的前提下,因此,这里
而不是
。
结论:如果要红豆,最好和路人交换一下。如果要绿豆,最好不要换。
假设有一个手写数据集,里面有100条记录,其中第0-9条记录是10个人分别写的0。10-19条是10个人分别写的1。……。第90-99条是10个人分别写的10,写了一个数字X,怎么判断是数字几呢?
朴素贝叶斯工作原理:
找到概率值最高的,就是对应的数字。
数学表达就是:
对于刚刚的手写数据集, 我们设数字的类别为 C_{k}, C_{0} 表示数字 0, \cdots \cdots 。刚才数字判别公式可以修改为
并且由于每一张图片是8x8的像素点组成,可以看作一个一维64数组,这里是把样本X拆开
因此上式可以化简为:
KaTeX parse error: Expected 'EOF', got '&' at position 45: …d X = x\right) &̲ = \frac{P\left…
其中
意味找到让后面这个概率最大的
,其中:
朴素贝叶斯法的参数估计
极大似然估计
在朴素贝叶斯法中, 学习意味着估计
和
。可以 应用极大似然估计法估计相应的概率。先验概率
的极大似然估计是
设第 j 个特征 x^{(j)} 可能取值的集合为
条件概率
的极大似然估计是
式中,
是第 i 个样本的第 j 个特征;
是第 j 个特征可能取的第 l 个值;
为指 示函数。