数据驱动型阿尔法模型在量化交易中的应用

推荐阅读时间:5min~6min 文章内容:数据驱动型阿尔法模型的介绍

上一篇:解读量化交易中的理论驱动型阿尔法模型

数据驱动型策略的优缺点

数据驱动型策略一般是指通过使用机器学习算法数据挖掘技术对选定的数据进行分析来预测未来市场的走向。相比于理论驱动型策略,数据驱动型策略相对难以理解,并且使用的数据工具也特别复杂。数据驱动型阿尔法模型,使用的输入变量主要是和交易相关的(绝大部分是价格数据),试图找出一些对未来具有解释能力的模式。

这类模型有两大优势:

  • 与理论型策略相比,数据挖掘明显具有更大的挑战性,并且在实业界使用较少,这意味着市场上竞争者较少。
  • 数据型策略可以分辨出一些市场行为,无论该行为目前是否可以用理论加以解释。

但是,数据挖掘型策略也有明显的缺点:

  • 研究人员研究的数据必须要与想要预测的东西存在较强的联系,否则会得到一些非常荒谬的结果。
  • 研究人员如果选取的所有认为有助于进行市场预测的变量,会导致所需要的数据量巨大,导致算法在运行时非常缓慢。
  • 这种使用历史数据来预测未来,相当于假定未来和历史的表现很类似,但实际上很多未来的走势会与历史数据差别很大。
  • 如果输入变量中噪音过大,包含很多错误信息,会误导分析人员,干扰其判断。

总之,仅仅使用数据挖掘技术去指定策略用于预测市场走向,通常并不可行。换言之:单纯地通过机器学习等算法来预测市场走向一般都是不可行的

数据驱动型策略的几个关键点

通常使用数据挖掘策略的宽客都是首先观察目前市场环境,然后在历史数据中寻找类似的环境,来衡量市场接下来的几种走势的出现概率,并基于这种可能性进行交易。在这一流程中,至少需要搞明白以下几个问题。

如何定义“目前的市场环境”

需要牢记一点:在量化交易策略中不允许存在任何模糊的余地。也就是说,仅仅告诉计算机“找出历史上与现在很相像的环境”是远远不够的,必须精确地定义“现在”以及“环境”具体指什么。“现在”可以指一瞬间、刚过去10分钟,过去10年等,这主要取决于宽客根据自己的偏好来进行选择。“环境”应该是指价格因素,还是交易量,或基本面数据?这不仅仅是一个学术问题:对小型技术公司股票的价格变动的处理方式和处理大型多元化金融公司的股价波动的手段是否相同,涉及市场如何运作的基本理念问题。

如何定义“相似”

如何定义“相似”这个概念呢?此外,随之而来的一个问题是:使用什么算法来寻找“相似”?这些都是最不容易概念化又最具有技术性的问题。所以,选择适用于所要处理的数据集的统计工具是极为重要的。关于统计工具的选择有很多技巧,但是对于如何选用统计方法很难有一个统一的回答。

如何确定历史数据的回溯时间段

很显然,追溯历史数据寻找相似模式时要回溯多久是个更直接的问题。通常是选择折中方案:一方面,选择时间点靠近现在的数据对预测未来作用更大。另一方面,将数据挖掘技术应用于当前含有噪音的市场数据集中时,统计学意义上的显著性通常是至关重要的。对于绝大多数统计学上的假设检验方法而言,样本量越大,从数据得到的结论可靠性越高。

所以,越近期的数据越相关,越多的数据结论越准确。因此,在对具有这种动态特征的系统进行统计分析时,宽客必须要在这些互相冲突的特征间进行权衡。

相关推荐:

解读宽客和量化交易的世界

解读量化交易中的理论驱动型阿尔法模型

作者:无邪,个人博客:脑洞大开,专注于机器学习研究。

原文发布于微信公众号 - 脑洞科技栈(naodong-open)

原文发表时间:2018-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【干货】个性化推荐十大挑战(中)

前文介绍了个性化推荐十大挑战的背景其中的数据稀疏性问题,冷启动问题。本篇介绍个性化推荐十大挑战中的大数据处理与增量计算问题,多样性与精确性的两难困境,推荐系统的...

40490
来自专栏AI科技评论

谷歌研究阻止“人工智能毁灭人类”的核心,都在这篇论文里面了

马斯克和霍金等科技界名人纷纷表示,要警惕人工智能失控。图片来源:CT。 人们一定还没忘记,今年谷歌DeepMind的人工智能软件AlphaGo打败了世界围棋大师...

307100
来自专栏大数据文摘

Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT)

310110
来自专栏机器人网

MIT分布式运算革新机器学习算法

从语音识别系统到自助停车等人工智能领域,“机器学习”的最新进展总能吸引大众的眼球。 所谓机器学习,就是让计算机在数据库中搜索特定模型从而获得新技能,以及让自主机...

34860
来自专栏量子位

谷歌再推AI开源平台AI·ON,你有机会参与Bengio的项目了

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 再次亮相。 首次推出一年后,谷歌又重新推出了AI开源项目讨论合作平台AI·ON(Artificial...

29860
来自专栏AI科技评论

谷歌、微软、OpenAI等巨头七大机器学习开源项目 看这篇就够了

在人工智能行业,2015-2016 出现了一个不同寻常的趋势:许多重量级机器学习项目纷纷走向开源,与全世界的开发者共享。加入这开源大潮的,不仅有学界师生,更有国...

500110
来自专栏人工智能快报

美情报机构拟资助研发可预测未来的智能工具

2016年7月6日,美国国防系统网发布消息称,美国情报高级研究计划局(IARPA)计划资助研发可预测未来的智能工具。 随着来自传感器及其他来源的信息的大量涌入,...

37170
来自专栏人工智能头条

猜你喜欢-----推荐系统原理介绍

23320
来自专栏AI研习社

Kaggle 推出四门免费线上课程:机器学习、R语言、数据可视化、深度学习

过去的一年里 Kaggle 取得了巨大的发展,除了加入 Google,Kaggle 还从一个主要关注机器学习的竞赛社区,扩展成为一个更广泛的数据科学和机器学习平...

57990
来自专栏腾讯大数据的专栏

大数据产品-腾讯信鸽之手游流失预测

背景 随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的收益。在游戏...

33550

扫码关注云+社区

领取腾讯云代金券