前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >sklearn 朴素贝叶斯

sklearn 朴素贝叶斯

作者头像
xindoo
发布2021-01-22 11:43:43
6000
发布2021-01-22 11:43:43
举报
文章被收录于专栏:XINDOO的专栏XINDOO的专栏

朴素贝叶斯是基于贝叶斯理论的一种监督学习算法,『朴素』意思是假设所有特征两两相互独立,给出类别y和一组依赖特征[x1..xn],根据贝叶斯理论,他们有如下的关系。

P(y|x_1,...x_n) = \frac{P(y)P(x_1,...x_n|y)}{P(x_1,...x_n)}

根据贝叶斯独立性假设

P(xi|y, x1,...,x_{i-1},...,x_n)=P(x_i|y)

对于所有的i,关系可以简化为

P(y|x_1,...x_n) =\frac{P(y)\prod^n_{i=1}P(x_i|y)}{P(x_1,....,x_n)}

因为P(x1,...,xn)}是给出的,所以我们可以做如下的近似

P(y|x_1,...x_n) =\frac{P(y)\prod^n_{i=1}P(x_i|y)}{P(x_1,....,x_n)}
\widehat{y} = arg \max_{y}P(y)\prod^n_{i=1}P(x_i|y)

我们可以用最大后验估计去估计P(Y)和P(xi | y),前者的相对频率可以通过训练数据集计算出来。

不同的朴素贝叶斯分类器的差异主要在于用了不同的关于P(xi|y)分布的假设。

尽管朴素贝叶斯过于简化假设,但在实际文件分类和垃圾邮件过滤中分类效果相当不错。朴素贝叶斯只需要少量的训练数据来估计必要的参数。(朴素贝叶斯效果好以及它适合哪种类型的数据理论解释,可参考下面的文献)

朴素贝叶斯学习器和分类器和一些复杂的方法相比,可以做到非常快。每个特征分布的解耦,意味着每个分布可以独立地当成一维去估计。这反过来又有助于缓解来自维数灾难的问题。

另一方面,虽然朴素贝叶斯以分类器著称,但它是一个坏的估计,所以不必计较从predict_proba得到的概率输出。

References:

H. Zhang (2004). The optimality of Naive Bayes. Proc. FLAIRS.

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-03-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • References:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档