我目前正在建立一个预测股市的数学模型。我了解到,做这种事情的最好方法不再是做一个大的最好的模型,而是把几个模型聚集在一起,这样就可以得到最好的结果。这种技术称为集成学习。
什么是最好的ensemble learning
方法?贝叶斯最优分类器?
我一定要学会合奏吗
如果问题不清楚,请告诉我。
发布于 2017-04-16 21:40:06
集合学习分为四个不同的类别:套袋、提升、堆叠、层次分类,有时他们认为分级是另一个类别。这些类别中的每一个都有许多不同的类型。例如,在促进你有阿达博斯特,格博斯和许多其他人。
理解这些类别之间的差异以及为什么每个类别都是重要的,这是非常重要的。让我给你一个简单的想法。套袋是非常重要的使用,当你有一个学习算法是不稳定的,套袋可以减少方差误差。当类内有变化时,be是非常重要的,be可以用来生成不同样本(特别是困难样本)的不同学习者,基于层叠的分类器是一种减少偏置误差的选择器算法。
强烈建议阅读一份关于集合学习的调查报告,以便更好地了解使用哪种方法。记住也要阅读可以用来测试和验证选择的交叉验证。还阅读了不平衡的数据库,以及如何使用过采样、欠采样和平滑算法来处理这些问题。
发布于 2017-04-17 09:34:31
我一定要学会合奏吗
你没必要做任何事。与机器学习问题一样,没有明显的答案能更好地/最好地解决问题。大多数情况下,你只需要试一试。
有关集成技术的一般概述,请参阅我的博客文章:https://martin-thoma.com/ensembles/
要找的关键词有:套袋,提升,堆叠。
https://datascience.stackexchange.com/questions/18396
复制相似问题