首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >概率生成模型

概率生成模型

作者头像
用户7043923
发布2020-03-12 00:52:08
6340
发布2020-03-12 00:52:08
举报

对于一个分类问题,首先要有数据,然后需要找到一个模型f,定义loss function,最后找到表现最好的f的参数。

从概率上讲,分类问题其实就是根据训练数据估计新的数据属于哪一类的概率。

在讲概率生成模型前需要介绍高斯分布函数。

image
image

输入是特征向量x,输出是x的概率,高斯函数的形状由均值和协方差矩阵决定。

image
image
image
image

首先假定训练数据的点服从高斯分布,那么我们需要找到训练数据背后的高斯分布,这样就能够给出新数据的概率。

如何找高斯分布模型呢?——使用极大似然估计的方法。

image
image
image
image

得到模型后就可以做分类了。

image
image

可以设定阈值,比如大于0.5就属于某一类。

image
image

事实上,对上述数据的分类准确率只有47%,即使考虑到其他维度的情况,准确率也只有64%.

因此需要改进模型,即两个高斯分布共享协方差矩阵,这样模型的参数就更少了。

image
image
image
image

改正后的模型准确率提高到74%,有意思的是分类边界变成线性的了。

image
image

可能最开始你就有疑问为什么要假定是高斯分布?其实这是视情况而定的,你也可以对二元特征使用伯努利分布。如果各项特征都独立,就变成了朴素贝叶斯分类器。

image
image

得到

image
image

下面从数学角度看看 z 是什么。

image
image
image
image
image
image
image
image

因为两个协方差矩阵是共享参数的:

image
image

最终得到z的表达式,其实是线性分类器。在概率模型中通过计算均值、协方差矩阵等来得到模型参数,

所以直接从训练数据中得到线性模型的参数不更好吗?

image
image
中国台湾大学 李宏毅 深度学习课程笔记:http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2017/Lecture/Classification.mp4
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-08-31 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 中国台湾大学 李宏毅 深度学习课程笔记:http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2017/Lecture/Classification.mp4
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档