前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据驱动型阿尔法模型在量化交易中的应用

数据驱动型阿尔法模型在量化交易中的应用

作者头像
abs_zero
修改2018-05-26 14:44:50
1.3K0
修改2018-05-26 14:44:50
举报
文章被收录于专栏:AI派

推荐阅读时间:5min~6min 文章内容:数据驱动型阿尔法模型的介绍

上一篇:解读量化交易中的理论驱动型阿尔法模型

数据驱动型策略的优缺点

数据驱动型策略一般是指通过使用机器学习算法数据挖掘技术对选定的数据进行分析来预测未来市场的走向。相比于理论驱动型策略,数据驱动型策略相对难以理解,并且使用的数据工具也特别复杂。数据驱动型阿尔法模型,使用的输入变量主要是和交易相关的(绝大部分是价格数据),试图找出一些对未来具有解释能力的模式。

这类模型有两大优势:

  • 与理论型策略相比,数据挖掘明显具有更大的挑战性,并且在实业界使用较少,这意味着市场上竞争者较少。
  • 数据型策略可以分辨出一些市场行为,无论该行为目前是否可以用理论加以解释。

但是,数据挖掘型策略也有明显的缺点:

  • 研究人员研究的数据必须要与想要预测的东西存在较强的联系,否则会得到一些非常荒谬的结果。
  • 研究人员如果选取的所有认为有助于进行市场预测的变量,会导致所需要的数据量巨大,导致算法在运行时非常缓慢。
  • 这种使用历史数据来预测未来,相当于假定未来和历史的表现很类似,但实际上很多未来的走势会与历史数据差别很大。
  • 如果输入变量中噪音过大,包含很多错误信息,会误导分析人员,干扰其判断。

总之,仅仅使用数据挖掘技术去指定策略用于预测市场走向,通常并不可行。换言之:单纯地通过机器学习等算法来预测市场走向一般都是不可行的

数据驱动型策略的几个关键点

通常使用数据挖掘策略的宽客都是首先观察目前市场环境,然后在历史数据中寻找类似的环境,来衡量市场接下来的几种走势的出现概率,并基于这种可能性进行交易。在这一流程中,至少需要搞明白以下几个问题。

如何定义“目前的市场环境”

需要牢记一点:在量化交易策略中不允许存在任何模糊的余地。也就是说,仅仅告诉计算机“找出历史上与现在很相像的环境”是远远不够的,必须精确地定义“现在”以及“环境”具体指什么。“现在”可以指一瞬间、刚过去10分钟,过去10年等,这主要取决于宽客根据自己的偏好来进行选择。“环境”应该是指价格因素,还是交易量,或基本面数据?这不仅仅是一个学术问题:对小型技术公司股票的价格变动的处理方式和处理大型多元化金融公司的股价波动的手段是否相同,涉及市场如何运作的基本理念问题。

如何定义“相似”

如何定义“相似”这个概念呢?此外,随之而来的一个问题是:使用什么算法来寻找“相似”?这些都是最不容易概念化又最具有技术性的问题。所以,选择适用于所要处理的数据集的统计工具是极为重要的。关于统计工具的选择有很多技巧,但是对于如何选用统计方法很难有一个统一的回答。

如何确定历史数据的回溯时间段

很显然,追溯历史数据寻找相似模式时要回溯多久是个更直接的问题。通常是选择折中方案:一方面,选择时间点靠近现在的数据对预测未来作用更大。另一方面,将数据挖掘技术应用于当前含有噪音的市场数据集中时,统计学意义上的显著性通常是至关重要的。对于绝大多数统计学上的假设检验方法而言,样本量越大,从数据得到的结论可靠性越高。

所以,越近期的数据越相关,越多的数据结论越准确。因此,在对具有这种动态特征的系统进行统计分析时,宽客必须要在这些互相冲突的特征间进行权衡。

相关推荐:

解读宽客和量化交易的世界

解读量化交易中的理论驱动型阿尔法模型

作者:无邪,个人博客:脑洞大开,专注于机器学习研究。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 脑洞科技栈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据驱动型策略的优缺点
  • 数据驱动型策略的几个关键点
    • 如何定义“目前的市场环境”
      • 如何定义“相似”
        • 如何确定历史数据的回溯时间段
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档