样本变量X,其中一个样本x,
n个属性 A_1,A_2,...A_n
样本的x的属性取值x=(x_1,x_2,...x_n)
样本有k个类别,C={c_1,c_2,...c_k}
则样本x属于类别c_i的概率为P(Y=c_i|X=x_i),即在样本x属性取值为x=(x_1,x_2,...x_n)的情况下属于类别c_i的概率
于此我们计算属于所有类别的概率取概率最大的情况,公式:
c=argmax_{c_i \in C}P(c_i|x)=argmax_{c_i \in C}P(c_i|x_1,x_2,...x_n)
其中argmax是取函数取最大值时的参数
使用贝叶斯公式:P(c_i|x)=\frac{P(x|c_i)P(c_i)}{p(x)}
得到
c=argmax_{c_i \in C}P(c_i|x)=argmax_{c_i \in C}P(x|c_i)P(c_i)\\P(x|c_i)=P(x_1,x_2,...x_n|c_i)\\=P(x_1|x_2,...x_n,c_i)P(x_2,x_3,...x_n|c_i)\\=P(x_1|x_2,...x_n,c_i)P(x_2|x_3,...x_n,c_i)P(x_3,...x_n|c_i)\\=...
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。