:伯努利假设是伯努利分布(其实应该是多变量伯努利分布),多项式假设是多项式分布,而高斯也就是假设是高斯分布(其实是多变量高斯分布).然后,我们细化到三种不同类型的朴素贝叶斯理论中....两个向量直接相乘,并不能得到最终的结果....1,假设xi=1x_i=1xi=1的概率是μ∈[0,1]\mu \in [0,1]μ∈[0,1],并且∑i=1dμi=1\sum_{i=1}^d \mu_i=1∑i=1dμi=1,则将得到离散分布...)是一个多项式分布.这样对应关系就是:
文档分类中的d维字典(d个特征)对应于多项式分布中的向量的d个维度;
文档分类中,词wiw_iwi出现与否,对应于d维向量中xi∈0,1x_i \in {0,1...,I(x)结果为1,如果x为假,I(x)=0.用语言描述来说,P(Y=ck)P(Y=c_k)P(Y=ck)这个概率等于在N个样本的数据集中,类别为ckc_kck的样本所占的比例.