标星★公众号 爱你们♥
近期原创文章:
正文
Tulchinsky是WorldQuant的创始人、董事长兼首席执行官。他曾是一名统计套利投资组合经理、风险投资家和科学家,也曾是一名电子游戏程序员。
Ghost Hunt - 由WorldQuant的创始人Igor Tulchinsky创作
在这里玩:
http://www.c64.cz/index.php?detailhry=22588&source=post_page---------------------------
Tulchinsky在德克萨斯大学获得计算机科学硕士学位不到9个月,他以其数学和系统的投资方式闻名WorldQuant。
WorldQuant为系统研究指定了一个而闻名Triple-Axis计划(TAP),分别是:
AXIS 1: IDEAS & DATASETS
第一个轴是想法和数据集( IDEAS & DATASETS)。有很多创造Alpha的想法,从均值回归、动量和趋势跟踪到价值、成长和最小波动率。
Igor Tulchinsky等人2015年推出了101 Alphas项目,其中有一篇名为《101 Formulaic Alphas》的论文。该论文列出了101个Alpha因子的伪代码,这些因子主要基于量价数据计算而来。
举一个例子,比如:Alpha #002
(-1 * correlation(rank(delta(log(volume), 2)), rank(((close - open) / open)), 6))
根据公式的运算顺序解析:
1、x0=log(volume)
解析:对成交量volume 取对数操作。
2、x1=delta(x0,2)
解析:利用当天的值x0减去过去第 2天的值x0。x0为 1的返回值。
3、 y1=(close-open) / open
解析:收盘价减开盘价的差,再除以开盘价。
4、x2=rank(x1)
解析:对每个股票的x1 值进行排序,返回其股票对应排名的boolean值(排名所占总位数的百分比)。
5、 y2=rank( y1)
解析:对每个股票的y2 值进行排序,返回其股票对应排名的boolean值(排名所占总位数的百分比)。
6、c=-1*correlation(x2, y2,6)
解析:计算x2 和y2 变量前6 天的相关系数。我们知道x2 和y2 表示股票的排序boolean 值。其计算逻辑是计算每只股票的前6 天的排序boolean 值的相关系数。
另一方面,根据相关系数的性质我们知道:
相关系数的值介于–1 与+1 之间,即–1≤r≤+1。
由此,当计算的相关系数越接近1,正相关程度越大。反之,相关系数越接近-1,负相关程度越高。而对相关系数乘以-1 进行取反操作,得到的alpha 值。表明alpha 越接近1,负相关程度越高,即股票当天成交量的增量程度与当天价格的增量程度负相关性越高。
因此,此公式是反映价量背离的规律的一个公式,买入alpha 值大的股票,卖出alpha 值大的股票,原理是买入加量背离程度高的股票。
公众号也曾分享过一篇关于101因子源代码的文章:
这几年国内兴起高频量价的研究。也是情理之中。
扯一句,这些因子怎么生成的,有一个观点是:
基于遗传规划
遗传规划(Genetic Programming,GP)用树状结构表示基因,而遗传算法的基因座是串行的。两者相比,遗传规划的扩展性,可变性更强。
1、遗传规划树状结构的节点是由“运算算子”构成的,这些算子包括了科学计 算(+,-,log,sin,sum),自定义算子(例如z=f(x,y)函数,a=rank (b)等)。
2、遗传规划的树状结构的层级和复杂度,随着迭代自动延伸,不需要对最终模型有先验判断。
3、理论上,基本数学和逻辑运算符,可以表述所有已知和未知的技术指标和交 易经验。但基于现有的运算能力,限定运算和数据范围能有效提高交易系统开发效率。
5个基因座编码的例子
编码类型
还有许多可用的数据集。最常见的是金融数据集,如行情价格数据集、公司基本面数据集、财务数据集等。最近,从基金经理、交易员到机构买方买方,这几年正在兴起一句话:
另类数据的崛起
因为它们可用作产生Alpha的新来源。
起初,另类数据的使用主要局限于量化投资经理,因为这些公司最适合获取、清理和处理这些数据。然而,随着基本面和混合资产管理公司对其兴趣的日益增长,另类数据已正开始成为主流。
另类数据是未发掘的Alpha
对投资者来说,本世纪最大的机遇来自在数字经济数据中产生的隐藏信号。另类数据是当今世界上最深入、使用最少的Alpha源!
——Quandl
6月份,Verizon为雅虎财经(Yahoo Finance)推出订阅服务,向散户投资者提供另类数据和研究分析,这让我们看到另类数据已逐渐成为主流。是的,你没听错:散户投资者。价格为每月34.99美元。
人们用在另类数据上费用一直在稳步增长。Greenwich Associates的报告显示:在最近接受调查的量化投资者和基本面投资者中,有一半以上的人正在考虑或使用另类数据,作为其工作流程的一部分!
Greenwich Associates的报告发现:绝大多数(72%)的投资经理表示,在一个过滤掉信号噪声的领域,另类数据正在改善他们的信号质量。在那些正在使用另类数据执行策略的人中,超过五分之一的人声称:他们从实际交易中获得了20%或更多的Alpha。
从2018年到2020年,这一数字可能会增长近两倍
NRI(Nomura Research Institute,日本野村综合研究所)Takeshi Shimamura写过一篇文章提到:
近些年,另类数据在资产管理行业中的使用越来越广泛。根据Opimas公司的预测,全球另类数据市场将从2017年43亿美元增长到2020年的90亿美元——在3年间翻一番。
另类数据更多的应用于偏股票型的量化对冲基金。近于实时的另类数据流有助资产管理公司提前获得大量股票买入或卖出的信号。除此之外,传统资产管理公司也已经开始使用另类数据来帮助提升人工制定长期投资决策的质量。例如,英国资产管理公司Schroders在2014年推出了一个“数据洞察部门”(Data Insights Unit,以下简称“DIU”)。DIU拥有30名数据科学家,他们分析各种另类数据,帮助投资组合管理团队制定中长期投资决策。
欧美市场也正在形成包括使用另类数据的资产管理经理、数据所有者和供应商的另类数据生态系统。例如,Orbital Insights和Prattle两家另类数据供应商,前者利用卫星图像估计原油库存,后者根据文本数据定量分析主要国家货币政策情绪。
根据新金融评论的报道:
从数据积累方面看
根据 IDC 的一份报告,2018 年全球有 33ZB 的数据,而这个数量预计在 2025 年会增长到 175ZB,这依赖于计算机算力的提升和存储设备技术的提高。
从另类数据公司数量上看
另类数据公司主要分为三类。一是原始数据提供者,这类供应商只收集最原始的另类数据,对于数据的处理程度最小;二是轻处理数据提供者,提供与金融资产相关的可视化数据;三是信号提供者,一般关注于某个特定行业,向资产管理公司提供打包好的量化投资信号。
从市场空间上看
另类数据统计表明截止 2017 年全球已有约 800 支基金利用另类数据做投资决策,2017 年投资机构对另类数据的投入规模约为 4 亿美金,行业正处于快速发展期,预计 2020 年可达 17 亿美金,CAGR 约为 45%。
投资机构为了获得超额收益,不断寻找新的市场阿尔法,但主动型基金在寻找市场阿尔法这个核心竞争力上的优势越来越弱:
1、因为市场有效性不断增强,基金经理很难找到被错误定价的资产;
2、因为大部分基金经理能得到的信息同质化,导致很难找到独特的信息优势和额外信息;
3、因为调研高度人工化导致人才的费用越来越高。
目前国内使用另类数据的多为对冲基金、二级市场基金及部分一级市场基金。另类数据可以给基金经理带来五点优势:
虽然基金经理使用另类数据寻找到新的阿尔法只是时间问题,但并不是所有另类数据都有潜力可以帮助基金公司获取市场阿尔法,因此另类数据公司在收集、清洗数据的同时,需要基金经理来评判数据是否有价值,同时高效的处理和应用将是降低成本和提升效率的关键,因此另类数据公司应当具备机器学习等技术开发能力和高效的产品策略。
AXIS 2: REGIONS & UNIVERSES
第二个轴是区域和全球(REGIONS & UNIVERSES)。该轴定义了策略的可交易范围。最多的地区是美国、欧洲和亚洲。在这个轴上,我们应该定义一个股票子集。标准可能包括:
对于国家/地区的筛选,通常的做法是使用常用基准指数,该指数为目标国家/地区的流动性和可交易证券提供一个标准和透明的定义。对于行业/领域,一种常见的方法是使用GICS或ICB等基准,这些基准提供了广泛认可的行业分类系统。
先锋持有被动基金逾一半的市场份额,其次是贝莱德、道富和富达。
被动基金市场份额
2018年ETF和基金流通量
ETF提供商市场份额的演变
发布年度最成功的ETF
2019年迄今推出的最成功ETF
ETF年初至今总回报
AXIS 3: PERFORMANCE PARAMETERS
第三个轴是参数性能(PERFORMANCE PARAMETERS)。参数性能被视为分析Alpha表现的方法,也可以解释为Alpha思想的来源。可能是夏普的Alpha,也可能最大回撤的Alpha。定义目标函数的参数性能是获取Alpha思想的关键。
来源:世坤
在国内,比如Wind的PMS:
来源:Wind金融终端
https://www.axioma.com/products/axioma-portfolio-1/axioma-portfolio-optimizer/hedge-fund-manager/?source=post_page---------------------------
结论
WorldQuant的Triple-Axis计划(TAP)为系统投资提供了一种简单易用的稳健方法。虽然机器比以往任何时候都强大,但我们仍然需要定义正确的目标函数和数据。
—End—
量化投资与机器学习微信公众号,是业内垂直于Quant、MFE、CST、AI等专业的主流量化自媒体。公众号拥有来自公募、私募、券商、银行、海外等众多圈内10W+关注者。每日发布行业前沿研究成果和最新量化资讯。