本期作者:Kei Nakagawa, Tomoki Ito, Masaya Abe, Kiyoshi Izumi
之前做了很多因子测试的工作,但一直没有总结,感觉很凌乱,决定花时间把这部分东西写一写,温故知新,也为后续学习打基础。首先写一下单因子测试部分,分三篇,数据预处理一篇, 回归法一篇,分层测试法一篇。本篇首先说明多因子模型是什么,随后着重于单因子测试流程及数据预处理的细节,附代码。
在量化投资领域中,因子(factor)就是对股票池进行筛选的指标。大家耳熟能详的因子模型(factor model)有
前言 在机器学习如何应用到量化投资的系列文章中,今天我们专门来介绍一篇来自国信证券的研究报告,来从券商角度分析这个问题。 对于最直接的问题:能否利用神经网络,要机器自己识别 K 线图,自己做出判断,本篇推文的内容无法给出肯定的答案,但也不能否定其可能性,回答它需要更为深入、更为复杂的神经网络。本篇推文的目的是利用深度神经网络中的 RNN 的一些基本结果,对多因子模型进行尝试,以检验深度神经网络在多因子、投资领域的适用性,使得投资者能够对神经网络有 更为实践的理解,并能够在投资领域有所运用。 RNN简介 R
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。 来自:Factor Zoo (.zip) 作者:Alexander Swade、Matthias X. Hanauer、Harald Lohre、David Blitz
近一个半月疯狂的接触多因子模型,其中对于单个因子的回测,是最熟的。而对于单个因子,或者叫做signal(这一系列文章后续都这么叫),是多因子模型的基础。当然,如果你认为,世界上没有alpha,那么只要bet style或者industry就可以了,也不需要寻找alpha。
过去几年Smart Beta因子投资策略开始在A股逐渐得到普及。虽然过去十年才真正红起来,其实Smart Beta这个词1970年就开始被机构投资者使用,在2003年也出现了第一个Smart Beta的指数基金。Smart Beta是一种长期可持续的因子,通过这种投资因子的分析,获得更高的回报和更低的风险。
量化交易策略无非三点:择时、选股、仓控。择时为短期套利交易策略,选股为中长期交易策略,目标是在中长期跑赢指数、获取市场超额收益率alpha。多因子选股的关键是找到寻找因子与股票收益率之间的相关性,即对收益率预测能力强的因子。一般多采用如下步骤:
本篇文章有别于传统的多因子研究,我们并未将重点放在阿尔法因子的挖掘上,而是通过对股票组合的权重优化计算,找到了在市值中性、行业中性、风格因子中性约束下的最优投资组合,以及验证得到的组合权重是否满足了约束条件。
本文参考了一些国外的文献和国内的报告,需要后文提到的报告的在后台回复“DCAM”获取。
主动管理决策是由预测和一致预期收益率之间的差异驱动的,套利定价理论在主动投资组合管理中具有重要意义,它给出了预测收益率的框架,但并未说明用什么因子预测,应用套利定价理论进行收益率预测和主动投资更像是一种艺术。
以前也算比较系统接触过机器学习吧,记得最早的时候是大二,机器学习才刚开始提起,更多的是说统计学习。那个时候,深度学习似乎都还没有听过,看的第一本书也是一本外国人写的,一直拿鸢尾花数据集当例子的书。当时看完也没觉得什么,毕竟年轻,何况那个时候很多东西就是觉得好奇好玩而去学一下。
不同国家的市场也是影响个股超额收益的因素之一,需要在收益模型中加入国家因子。为了让收益模型解唯一,约束市值加权的行业因子收益率之和为零。
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 前言 量化投资总是蒙着一层神秘的面纱,似乎可以无时无刻打败市场。但金融市场本身是一个充满很多不确定性的复杂系统,量化投资就是为了在这种高度不确定性中努力提高投资中科学的成分,这样才能减少投资结果的随机性,增加投资收益的
多因子模型在量化投资中占据了绝对的C位,以Barra风险模型,采用截面因子暴露对股票收益率进行建模的方法在业界得到了广泛的使用,可以用非常简单的等式表示截面股票收益与因子暴露之间的关系:
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号独家解读 量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者
之前在A股动量与反转的实证过程中,提到了因子择时和风格轮动的重要性,本篇算是对因子择时的一个小小的尝试,没有什么创新性,只是把现在比较传统的方法都拿来试了一遍,目前没有能力创造方法,只做方法的搬运工。
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 Combining Factors Christoph Reschenhofer (Vienna University of Economics and Business) / July 2022 学术文献主要通过组合收益
新开一个系列写写组合优化的相关内容,主要以分享看到的各种研究和思考为主,偏理论。
因子策略的开端,要从Fama-French 在资本资产定价模型上提出三因子模型说起,其在原有的市场因子Beta上,加上市值因子SMB和账面市值比因子HML,指出Beta不能完全解释不同股票回报率的差异,所以还应考虑上市公司的市值、账面市值比、市盈率的差异。
有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面和完整。从今日起,量化投资与机器学习公众号将推出一个系列【机器学习该如何应用到】。今日的推文,是编辑部人员对国内的所有券商金工团队做的机器学习的研究报告做了一个系统性的整理。希望大家有所收获。 获取本推文所有研报请看文章末端 系列文章(点击即可查看) 机器学习该如何应用到量化投资系列(一) 机器学习该如何应用到量化投资系列(二) 2010年08月1
因子投资已经存在很长时间了,学术界和实践中都有大量的文献致力于研究它。然而,关于它的许多困惑仍然存在。我们已经讨论过价值、动量、低风险和规模等风格因子投资的事实和误解(Fact and Fiction),这篇文章将结束本系列文章,回顾关于一般因子和多因子投资方法的事实和误解。
beta本质是资产收益和市场收益的关系,一单位市场超额收益的变化(Rm-Rf),会导致资产收益变化多少
单因子模型,考虑策略风险(即IC时序波动),最大化风险调整后收益的主动增强组合优化
找不到完整的学习路线?小编分享2020年Python学习路线及学习目标规划拿走不谢,Python作为今年来特别受欢迎的编程语言,是AI时代头牌语言AI领域的敲门砖,Python已经入驻小学生教材,将来不学Python不仅知识会脱节与小朋友都没共同话题了,作为程序员的我们,必须给自己增加一项技能,提高职场竞争力,掌握一定的Python技能。
有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面和完整。从今日起,量化投资与机器学习公众号将推出一个系列【机器学习该如何应用到】。编辑部花了很长时间,采访和咨询了很多研究人员。希望各位读者有所收获,如有不足,欢迎批评指正。 一、什么是机器学习 机械的定义避开不谈,回答也不追求全面准确。明确一点,机器学习的主要目的在于发现规律或重现规律。(此处不谈非监督学习、强化学习,也不谈降维、集成算法)。什么是
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 今年春节,微信为了感谢「量化投资与机器学习」对微信原创生态的贡献,免费了送了20万个微信红包封面。 QIML 今年的红包封面,受到了圈内的无数人的喜爱与赞美,发红包的人数近16万,拆红包的人数近100万! 不过,领取的红包封面3个月内有效,最近很多人告诉我们红包封面过期了。
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 今年春节,微信为了感谢「量化投资与机器学习」对微信原创生态的贡献,免费了送了20万个微信红包封面。 QIML 今年的红包封面,受到了圈内的无数人的喜爱与赞美,发红包的人数近16万,拆红包的人数近100万! 不过,领取的
在开发股票投资模型这项工作中,很少有凭空搭建的楼阁。尽管可以使用机器学习类的工具增强模型性能,但是大部分模型的基础结构,依然基于传统的资产定价模型和因子分析演化而来。
新开一个文献分享系列。今天分享一篇UBS的研报,获取原文后台回复“paper1”。
本系列的第一篇因子加权方法中提到,对于因子间有相关性的情况,可以通过最大化IR来解决,但也会存在另一个问题:因子协方差矩阵的估计,文中对比了最原始的样本协差阵和Ledoit压缩估计量结果的差异,表明协方差矩阵的估计效果对于结果有很大影响。本文给出另一种更为常用的解决因子间相关性的方法:因子正交化。
这篇没有新的内容,只是把一个老的掉牙的东西,想的更清楚一些。关于正交化,很早之前写过一篇《因子正交化》,细节可以参考这篇,不再展开。
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 Journal of Portfolio Management在2022年的开年给大家送出了因子投资特刊。本期特刊也是因子投资的第七本特刊,总共包括了14篇关于因子投资文章,其中有8篇来自业界,5篇由业界和学术界共著,还有1篇来自学术界。 The Future of Fac
SignalFactorAnalyse单因子测试框架哪些因子可以为组合提供超额收益?这是构建多因子模型的第一步,也是最关键一步。 特征选择非常关键,只有把握关键特征才能对数据达到重要性认识,选择好的因子,才能获取超额收益率。 对于传统交易经验、金融理论、微观市场、机器学习、深度学习等不断挖掘出来的巨量待验因子,一个快速且有效的因子测试框架,将是Multi-factor策略系统中最为关键的一环。 因子模型测试思路 因子有效性的判断与筛选: •备选因子确定: 数学意义、经济意义、统计意义 •预处理: 数据空缺与
用于分析投资组合风险的最受欢迎的模型是因子模型,因为股票具有共同移动的趋势。证券的主要组成部分经常会解释很大一部分差异。由于我们主要关注构成投资组合的多种资产,因此需要对此进行说明。有些问题可能是为什么低市净率的股票要比具有较高市净率的股票好吗?在此,比率的“价格”部分仅是股价(每股),比率的“帐面”部分是“股东权益” /“流通股”,这是公司资产负债表上的项目。
1、因子筛选应与所用模型相匹配,若是线性因子模型,只需选用能评估因子与收益间线性关系的指标,如IC、Rank IC;若是机器学习类的非线性模型,最好选用能进一步评估非线性关系的指标,如 Chi-square 及 Carmer's V 等;
之前公众号分享过网友自行编写的WorldQuant 101因子源代码,大家有需要可以点击链接进行免费获取。
👆点击“博文视点Broadview”,获取更多书讯 在本月的TIOBE编程语言排行榜中,Python与去年同期相比上升了一个名次,战胜了Java,位列第2名! Python能够取得如此成绩,离不开其丰富的使用场景! 无论你是技术开发人员,还是普通的职场办公人士,都可以使用Python来解决自己工作中的问题。 本期就来给大家分享13本今年出版的Python类新书,从技术开发到机器学习算法,从数据分析到数据可视化,从自动化办公到股票分析……希望可以帮助大家找到适合自己的那一款! ---- 01
上一篇文章跟大家分享了因子投资中的事实与误解,今天我们来讨论下“量化金融中机器学习的实验设计和常见陷阱”。一共汇总了三篇非常优秀的论文:
今天我们来读一篇来自国信证券研究文章 RNN简介 RNN 不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时间的结果不仅受下一时间的输入的影响,也受上一时间输出的影响,进一步地说就是信息具有持久的影响力。放在实际中也很容易理解,人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想的也是参与进去这次信息的推断的。人类的大脑 不是一张白纸,是包含许多先验信息的,即思想的存在性、持久性是显然的。举个例子,你要对某电影中各个时点发生的事件类
股票投资组合的收益率由何种因素决定?这个经典的问题,驱使着一代又一代的金融大师们,持续地对股票市场进行研究。最早的资本资产定价模型(CAPM模型)其实在1961年就有了雏形。
【30秒速览】 【【002】高风险高收益,常识or谎言?】一文介绍了低风险异象的常规定义和主要实证表现,并给出了研究者提出的多种低风险因子的列表。本文则更进一步,详细介绍每一种因子的具体定义,帮助您更好地理解它们的异同。
因子挖掘是量化交易的基础。随着历史交易数据日益增多,交易市场量化竞赛的不断升级和进化,量化投研团队开始面对数据频率高、因子数量多的场景,以10分钟线10000个因子5000个股票为例,一年的因子数据约为 2.3T 左右,1分钟线的数据量达到23T,3秒线的数据量将达到460T。如此量级的数据就对因子存储方案提出了很高的要求。
多因子方差分析的因子交互作用可以这样理解,比如经常吃的消炎药头孢,通常会认为服用三片要比服用一片效果好,但经过实际验证测试发现,男女之间用药效果并不相同。对于男性而言,吃三片的效果好些,而对女性而言,吃一片效果要更好。这种情况下,头炮剂量和性别之间便产生了了交互作用。
前五期传送门: 【系列55】机器学习应用量化投资必须要踩的那些坑 【系列54】因子的有效性分析基于7种机器学习算法 【系列53】基于XGBoost的量化金融实战 【系列52】基于Python预测股价的那些人那些坑 【系列51】通过ML、Time Series模型学习股价行为 今天,继续我们的机器学习应用量化投资系列。本期我们再介绍一篇杨勇团队撰写的研究报告。希望大家在写策略注意这些问题。 前言 从IC、IR到另类线性归因 基于IC、IR的单因子分析是传统多因子分析的基石。但是IC、IR分析出却不能考虑到多
指数基金一般是小白投资理财的首选,可是,你是否知道指数基金背后的构造逻辑呢? 都说投资时不懂不要投,相信当我们了解了其背后的构造逻辑后,能够更好地选择基金产品,也能更安心地赚钱! 本文就带大家来了解一下构造指数基金背后的因子及构造因子的另类数据。 以下内容节选自《因子投资:方法与实践》一书! ▼扫码获取本书详情▼ ---- --正文-- 自20世纪80年代末以来,业界开始把学术界的研究成果很好地落地,形成了许多风格因子指数,比如价值和成长因子。 1992年,先锋推出了第一支价值指数基金和第一支成长指数基
随着Python编程语言的流行和普及,越来越多人对如何应用Python做金融数据分析和量化交易充满兴趣。但是不少人对量化投资本身存在一定的误解或认识不清,有的人过于异想天开,认为可以躺着挣钱(怕是只有岛国老师吧);有的人则因循守旧,认为没啥卵用;也有的人盲目追求模型的复杂性,在编程和数学中迷失了方向。
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈
4.创新的预训练方法可大幅提高语言模型准确度:Similarity Sampling 和Source Prompt
金融圈里,大家一直在探索一个问题,那就是:什么因素能驱动股票带来长期回报?在市场有效的情况下,要想获得超额收益,就要承担更多的风险,但在承担风险之前,我们必须要搞清楚,承担这份风险为什么能带来超额收益。因而在学术界,研究者们也一直在探究:到底要承担什么风险,才能带来超额收益?
领取专属 10元无门槛券
手把手带您无忧上云