:
EM算法在多元正态分布缺失的数据下一般都是有较为广泛的应用,所以在这样典型的应用情境下,我将主要研究EM算法在二元正态分布下的应用.
1:二元正态分布的介绍:
设二维的随机变量(X,Y)的概率密度为...t:
即可以得到:
同理:
哼,证明证明出来了
性质2:正态分布的条件分布仍是正态分布
二元正态分布(X,Y) ~N(u,M),其中:
求证:
证明过程如下:
2:对于二元正态分布均值的MCEM...估计:
设总体Z=(X,Y)~N(u,M),其中:
现在有如下的观测数据:
显然这个数据是缺失的,如果数据完整的话,那么这个参数估计起来很简单,用极大似然估计就OK,但是这样的数据不完整的情况下,用极大似然估计求参数是非常困难的...,现在我们知道EM算法对于缺失数据是非常有利的,现在我们用EM算法来求:
假设协方差矩阵
估计未知参数:
首先以u=[2,4]为例产生二元正态分布随机数,并将产生的随机数扣掉一部分数据,将扣掉的这一部分数据当成未知的缺失数据...,但是计算还是太复杂,更有意思的是如何巧妙地拓展参数空间进行加速收敛.还有在高斯混合模型研究中,本文是因为事先知道GMM分支的数量来 进行估计的,但是如果给的是一堆杂乱的数据,需要解决如何确定分支的问题