首页
学习
活动
专区
圈层
工具
发布
35 篇文章
1
机器学习在量化金融领域的误用!
2
专栏 | 监督&强化学习模型在金融市场的应用
3
【机器学习课程】经典算法之——AdaBoost在量化投资中的应用(附代码和很多论文资料)
4
一名Quant的自白
5
Two Sigma:Machine Learning Models of Financial Data
6
【深度】监督&强化学习算法在A股中的应用
7
深度学习与时间序列预测:来自Kaggle比赛的宝贵经验
8
啥是佩琪?恕我直言,搞量化这样配齐!
9
有人说:机器学习应用量化投资没啥用,给你看看有用的!
10
机器学习在金融风控的经验总结!
11
推荐收藏 | 深度学习在金融领域的应用
12
机器学习在金融风控的经验总结!
13
原创 | 支持向量机在金融领域的应用
14
Kaggle大神经验分享丨如何用15个月冲到排行榜的首位
15
Kaggle Grandmaster是怎样炼成的
16
我要这金牌有何用:Kaggle 竞赛成绩真能「保送」谷歌、FB 吗?
17
Kaggle参赛入门经验
18
Kaggle大神们的致胜法宝!
19
收录超十年,Kaggle竞赛优胜解决方案、思路大合集!
20
Kaggle大神亲述:我是如何半年拿5次金牌晋升Grandmaster的?
21
跟Kaggle大神17枚金牌得主学NLP实战
22
从0开始如何用一个月杀进机器学习比赛Top25%
23
Kaggle 大神 Eureka 的高手进阶之路
24
半年5战5金:Kaggle史上最快GrandMaster是如何炼成的
25
Kaggle 顶级大师成长笔记
26
印度裔Kaggle大神自述:我是如何获得所有4个类别的Grandmaster
27
从0自学成AI高手,她只用了一个产假
28
Kaggle Grandmaster 的 NLP 方法
29
17岁Kaggle Grandmaster:从14岁开始的学习之路、竞赛经验谈
30
知乎 | 一年半的时间成为算法工程师,这可能吗?
31
Kaggle 大神Dan Becker与你分享他的数据科学之旅!
32
分分钟带你杀入Kaggle Top 1%,8000字实战分享
33
Kaggle 商品销量预测季军方案出炉,应对时间序列问题有何妙招
34
逻辑是怎样炼成的?
35
LSTM还没「死」!
清单首页quant文章详情

【机器学习课程】经典算法之——AdaBoost在量化投资中的应用(附代码和很多论文资料)

1算法简介

AdaBoost是由Yoav Freund和Robert Schapire提出自适应增强的一种机器学习方法。AdaBoost算法的自适应在于:前一个分类器分错的样本会被用来训练下一个分类器。

AdaBoost是一种迭代算法,在每一轮中加入一个新的弱分类器(新的因子),直到达到某个预定的足够小的错误率。在训练样本时,每一个样本都被赋予一个权重,表明它被某个分类器选入训练集的概率。第一次分类后,如果某个样本已经被正确地分类,那么它的权重就会降低,因为它被下一个分类器选中的概率被降低;反之,如果样本被分类错误,它的权重就会增加。通过这样的方式,AdaBoost算法能"针对"那些难以分离的样本上。因此,在量化分析预测股票的走势上,AadaBoost常能比其它算法更加胜任。

2数据处理

在将此算法搬运到预测股票涨跌之前,我们需要做一些调整避免AdaBoost算法的"水土不服"。

1)由于AdaBoost算法对于噪声数据和异常数据极其敏感,简答地将训练样本分类涨与跌为(+1,-1)可能会对结果造成极大影响。所以,处理时可以去除样本中不明显的涨跌(如<1%)保留噪声较少部分。

2)在弱分类器的选择上,大家可以加上任何有相关性的因子。但是,值得注意的是,需要将因子的值划在同一区间内,这样可以极大减少极端值的影响。

3算法应用

为了方便解释,这里选择了三层(L层)弱分类器,分为两组(G组)。

1)首先,我们有训练样本D={xi = (Xi1,Xi2,Xi3),Yi}, 这里i表示第i个样本,xi表示每个样本对应的三个因子, Y代表每个样本对应的需要学习的值——涨(+)或跌(-)。

2)起初,如图一,我们赋予每个样本同样的权重 wi = 1/n,图中显示每一个圆圈大小一致。然后,我们尽可能使得错误分类得将样本一分为二,分成两组。

并记录该训练误差。

3)计算判决分数 :

4)更新权重,如图二、三,将分类正确地权重降低(圈圈变小),分类正确地权重降低(圈圈变大)。

5)得到最后的分类器:

6)现在可以通过得到的分类器的值来预测涨跌幅,分数越高则走涨的可能性却高,分数越低则走跌的可能性越大。

4参考文献

参考文献:

http://blog.csdn.net/dark_scope/article/details/14103983

代码推荐:

https://github.com/justdark/dml/tree/master/dml/ADAB

5论文资料获取

下一篇
举报
领券