我试图复制这论文的结果,但是使用python和HMMlearn库来代替matlab。本文介绍了一种利用隐马尔可夫模型( HMM )预测股票价格的方法。
本文详细介绍了用四态5混合高斯分布作为模型.转移概率和初始状态概率是一致的,但发射概率是根据现有股票价格数据集的k均值算法的结果来确定的。
后半部分是我陷入困境的地方,本文建议使用k-均值算法返回的每个聚类的均值、方差和权重作为混合算法每个组分的均值、方差和权重。据我所知,星系团的平均值只是每个质心的中心,但是我不知道你如何获得方差或权重。
给出一个三维数据集X(以[[a, b, c], [d, e, f]...]
的形式),并使用k-均值算法,其中k=5 (k =混合组分的数目),我将如何确定每个簇的权重和方差?
发布于 2016-04-28 19:32:09
用k-均值对混合高斯模型进行EM初始化是有效的.如前所述,每个组件的平均值将是属于同一个集群的所有样本的平均值(这取决于使用的聚类算法,有时质心不是集群的平均值,而是样本之一)。对于权重,可以使用以下方法:集群的权重x=样本数属于集群x,除以样本总数。因此,样本数最多的聚类是权重最高的聚类。对于方差:只需找到所有样本的方差属于同一个集群。
https://datascience.stackexchange.com/questions/11487
复制相似问题