首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何获得k均值簇的权重和方差?

如何获得k均值簇的权重和方差?
EN

Data Science用户
提问于 2016-04-28 16:13:53
回答 1查看 2K关注 0票数 2

我试图复制论文的结果,但是使用python和HMMlearn库来代替matlab。本文介绍了一种利用隐马尔可夫模型( HMM )预测股票价格的方法。

本文详细介绍了用四态5混合高斯分布作为模型.转移概率和初始状态概率是一致的,但发射概率是根据现有股票价格数据集的k均值算法的结果来确定的。

后半部分是我陷入困境的地方,本文建议使用k-均值算法返回的每个聚类的均值、方差和权重作为混合算法每个组分的均值、方差和权重。据我所知,星系团的平均值只是每个质心的中心,但是我不知道你如何获得方差或权重。

给出一个三维数据集X(以[[a, b, c], [d, e, f]...]的形式),并使用k-均值算法,其中k=5 (k =混合组分的数目),我将如何确定每个簇的权重和方差?

EN

回答 1

Data Science用户

回答已采纳

发布于 2016-04-28 19:32:09

用k-均值对混合高斯模型进行EM初始化是有效的.如前所述,每个组件的平均值将是属于同一个集群的所有样本的平均值(这取决于使用的聚类算法,有时质心不是集群的平均值,而是样本之一)。对于权重,可以使用以下方法:集群的权重x=样本数属于集群x,除以样本总数。因此,样本数最多的聚类是权重最高的聚类。对于方差:只需找到所有样本的方差属于同一个集群。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/11487

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档