从概率分布的角度看待模型。 给个例子感觉一下: 如果我想知道一个人A说的是哪个国家的语言,我应该怎么办呢?
它们的区别在于:
对于输入x,类别标签y: 生成式模型估计它们的联合概率分布P(x,y) 判别式模型估计条件概率分布P(y|x) 生成式模型可以根据贝叶斯公式得到判别式模型,但反过来不行。
一些理论可看:On Discriminative vs Generative classifiers: A comparison of logistic regression and naive Bayes。
http://papers.nips.cc/paper/2020-on-discriminative-vs-generative-classifiers-a-comparison-of-logistic-regression-and-naive-bayes.pdf