生成式模型
$$ P(Y|X) = \frac{P(X, Y)}{P(X)}$$
生成式模型为了对$X$进行分类,会对如何生成数据进行建模,学习联合概率密度函数$P(X,Y)$。然后基于学习的联合密度函数$P(X,Y)$,预测哪一类最有可能。而这也是为什么他叫生成式模型,因为模型表示了给定输入$X$产生输出$Y$的生成关系,根据联合概率$P(X,Y)$和已知的先验分布来计算后验分布$P(Y|X)$,而$P(X,Y)$可以看成生成样本$(X,Y)$的概率。
常见的生成模型有:朴素贝叶斯和隐马尔可夫。
判别式模型
$$P(Y|X)$$
判别式模型直接求的就是$P(Y|X)$即给定输入$X$的条件概率。不关心数据如何产生,只关心怎么分类就行了。而判别式模型,是直接根据$X$给出$Y$的判别。
常见的判别式模型有KNN,感知机,逻辑回归,决策树,最大熵,boost以及CRF等。
生成式模型vs判别式模型
- 生成式模型和判别式模型都是用于分类问题的。分类问题的目标是给出输入$X$,预测它的类别$Y$,即:
$$Y=f(X)$$
或者
$$P(Y|X)$$ - 生成模型是利用数据学习联合概率密度分布,而判别模型是利用数据学习条件概率分布。
- 存在隐变量时候,可以使用生成式不能使用判别式
- 生成式方法可以计算联合概率分布$P(X, Y)$
参考文献
1.https://www.quora.com/What-are-the-differences-between-generative-and-discriminative-machine-learning
2.https://www.zhihu.com/question/20446337/answer/256466823