首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

单因子测试(上)——因子中性化

股票市场中不同市值、不同行业、不同风格的股票,对于因子的响应性不同,因此,在进行因子测试前,我们必须对因子进行处理,剔除掉因子中可能包含的其他因素,处理方法也与计量中的方法类似——加控制变量,这里叫做因子中性化...,实际操作中,我们一般只考虑市值和行业造成的影响,对这两方面的处理分别称为市值中性化行业中性化。...行业中性化 行业中性化有两种方法,一种是之前所说类似计量中加控制变量的方法,用因子值做因变量,用所属行业(申万行业、中信行业)虚拟变量做自变量进行OLS回归,用回归之后的残差值代替因子值。...另一种方法是对因子分行业进行标准化,即减去行业均值之后再除以行业标准差,可以证明,两种方法得到的结果是完全一样的。第一种方法的代码相对简单,并且可以和市值中性化一起进行,因此一般采用第一种方法。...一般将行业虚拟变量和市值同时放在自变量上进行回归,同时进行市值中性化行业中性化,理论上可以证明,回归后的残差序列与自变量序列均正交,因此可以认为回归后的残差是因子剔除了行业和市值影响后的纯净的因子。

11.6K99

探寻量化Alpha:产业链提纯因子

选股因子在行业的暴露度过高可能会导致股票过于集中而带来的极端风险。这会影响选股因子有效性的判断。 A股行业市值效应明显,为降低选股因子在行业和市值的暴露度,我们通常会进行市值和行业中性化处理。...行业中性化的本质在于使用行业定义来确定股票的相似群组,找到股价共同移动概率较高的股票,最终达到在不同群组中分散化投资的目的。...标准化产品)提纯‘替换’行业中性化处理的因子表现如何。...实验组及对照组因子均为做过预处理:异常值、标准化处理,市值中性化处理,对照组行业分类为申万一级行业(2021年6月更新版本)。...IC分析结果比对: 通过IC分析结果对比,不论从因子有效性、稳定性还是预测能力来看,SAM提纯后的因子效果都显著优于行业中性化处理的因子。

38150
您找到你想要的搜索结果了吗?
是的
没有找到

业绩超预期因子

回测区间:20091231-20191231 全A股,剔除ST和新股 计算因子IC,先看不做行业市值中性化的结果 SUE-含漂移项 ? SUE-不含漂移项 ? SUR-含漂移项 ?...不做中性化时,带漂移项的业绩超预期因子ICIR更高,不带漂移项的因子IC更高。 对因子用申万一级行业和流通市值做市值行业中性化后计算IC如下 SUE-带漂移项 ? SUE-不带漂移项 ?...可以看出,中性化后,因子稳定性明显上升,ICIR变大。 分层测试结果 限于篇幅,这里只给出中性化后的,未中性化的结果可以在代码文件中查看。 SUE-带漂移项 ? SUE-不带漂移项 ?...04 业绩超预期模拟组合 接下来给出在米筐和聚宽平台上,模拟组合的结果 回测区间:200912-201912 股票池:中证800 规则:中性化后的因子降序排列,买入最大的100只股票,每月末月度调仓...SUE-带漂移项-不中性化 ? SUE-不带漂移项-不中性化 ? SUE-带漂移项-中性化 ? ? SUE-不带漂移项 ? ?

2.6K20

AQR:Value Investing Is Not All About Tech

报告的关注点在于行业内价值和行业间价值的差异,主要论点论据是以下两张图 上图是是用五个行业中性化的估值因子等权合成后,计算的value spread,因为做了行业中性化,所以反映的是行业内的(with-industry...(多头代表价值,空头代表成长) 上面是第二张图,这张图的value spread是IT行业相对标普500的value spread,IT行业用的GICS Information Technology...如果用IT行业代表成长,其他行业代表价值,那么这个spread和上面的spread可以进行比较。...差异仅在于,上面的图表示的是行业内的value spread,下面的图是行业间的value spread。换句话说,上面是从每个行业中选低估值的票,下面是从所有行业中选低估值的行业。...也就是说,虽然目前两种方式去做价值都有很好的表现,但行业内的价值,看上去风险更小,赌行业的风险更高 大佬最后给的总结

30620

多因子模型之因子(信号)测试平台----因子值的处理(二)

我们知道,一个因子值的处理大致分为三个步骤,去极值、标准化、中性化,上次我们对因子值进行了去极值和标准化,这一次,我们主要讲一讲中性化,也就是neut。        ...neut分为行业中性和风格中性两种。行业中性很好理解,我们知道,一个因子在不同的行业间不一定有可比性。譬如资产权益比,也就是杠杆率。...显然,有的行业杠杆率很高,比如房地产行业,而有的行业则杠杆率不高,比如传统机械制造行业。再比如PB,有的轻资产行业PB很高,比如软件,而有的行业PB很低,比如煤炭。...第二种方法既可以用于行业中性,也可以用于风格中性,叫做残差法。也就是做一个回归,其中,因子值是y,需要中性的风格因子的暴露为x,然后我们进行回归。回归之后的残差就是因子值对行业中性化后的值。...2.行业中性化         由于分风格因子通常会购买barra的数据服务,所以,这里我们只进行行业中性。         首先,我们需要获得行业数据,也就是每个股票行业的类别。

1.2K40

单因子测试框架

JupyterNote 数据来源:通联数据 依赖包:数据处理(pandas、numpy)、数学工具(scipy、自带包statsmodels)、绘图包(matplotlib、seaborn) 数据预处理与中性化处理...因子中性化 因子中性化是为了避免因子与某些行业和风格过度耦合所带来的偏差。...本文中对因子进行了行业和市值的中性化,主要做法是:对每期的因子值对行业哑变量和流动市值做线性回归,取得回归的残差作为对原始因子值的替代。 标准化与去极值还有很多计算方式可参考,本文从简。...在本测试中,不会对公司所属行业进行比例拆分,即股票只能属于一个特定的行业,在本行业上的暴露度为1,在其他所有行业的暴露度为0。...在利用IC值评价因子有效性时,需先进行因子中性化处理(与回归分析法一致)。

2.3K50

【最新研究】基于风险中性的深度学习选股策略

行业中性的样本标注:寻找不同行业内能够跑出超额收益的股票 训练时,根据未来一期的股票涨跌幅来给样本贴“标签”:上涨、下跌、平盘 同一时刻,按照涨跌幅进行排序,确定样本的输出标签。...深度学习因子与流通市值的相关性:IC序列的相关性 经过行业和市值中性化之后,深度学习因子更少受到市值因子的影响。...深度学习因子与流通市值的相关性:截面相关性 经过行业和市值中性化之后,深度学习因子更少受到流通市值因子的影响。...总结 将风险因子中性化处理后,可以构建新的深度学习选股模型,该模型受风险 因子的影响较小。...即使是采用同样的特征和模型结构,风险因子中性化之后,训练的策略也会 有较大的差别,可以通过此方法丰富深度学习选股策略的多样性。

1.7K50

因子评估全流程详解

关于因子评估,很早之前写过三篇单因子测试的三篇文章:上、中、下,分别写了因子中性化、回归测试和分组测试,也可以参考这三篇。...接下来做一些因子和股票未来收益的分析,这部分也是大家最关注的部分,做之前首先做中性化处理。 04 因子中性化 因子中性化主要是为了剔除因子在行业和市值上的特异性,让因子在行业和市值上可比。...比如从上面的分析也可以明显看出, 每个行业的因子大小和稳定性是有明显差异的,所以如果直接构建组合,结果会明显集中于部分行业。有时除了这两个之外,也会考虑更多因素,做一些风格中性化,或者说正交化。...中性化的原理为用因子值对市值和行业虚拟变量做回归,取回归的残差,因为回归残差和自变量之间是相互正交的。另外也可以证明,对行业虚拟变量回归去残差和在行业内减均值除以标准差的效果是一样的。...,当然这里因为已经做过了中性化,实际上可以认为在每个行业上的暴露是差不多的。

2.5K44

刀尖上的舞蹈?股票Alpha模型与机器学习

不同行业内的上市公司财务基本面数据有行业特色,价格波动率也有行业特色,所以需要在行业之间做中性化,剔除行业影响。...方法可以是通过行业哑变量0-1区分该股票是否属于该行业,还可以给与跨行业公司不同的行业权重,还可以按照股票和一级行业走势的相关性来确定行业权重。 ?...某因子中性化前后的因子top-bottom对冲性能对比 如上图,一个短期量价因子做了行业和主要风格中性化前(上部分),对冲净值曲线,和中性化后(下部分),性能差异显著。...理论上中性化会带来alpha模型的超额收益部分性能提升(特别是回撤降低),因为某些时段特殊的风格因子会导致alpha不稳定,我们在交流中说的风格坑、行业坑,就是不做中性化导致的alpha超额收益曲线不稳定...最终的模型打分结果可以再次中性化处理 还有一种方式被称为“后置中性化”,如上图,其针对模型每日的股票打分当作一个因子,使用行业哑变量和风格风险因子,对打分做中性化线性回归处理。

1.6K10

蒸馏Alpha:因子的可交『弈』性

“是在一个大的平台里追求安稳,还是在去初创的公司搓破天花板,这其实是每个行业都会遇到的选择。但尤其在量化行业,你会发现这两种选择显得更为两极化。...但当我看到国内量化行业的蓬勃发展,我还是毅然选择离开世坤,并深入的参与到国内的市场竞争中来。”...如果以多空策略为例,Alpha的本质就是在截面上,通过组合的优化及风险的处理(这时由于做空限制的放开,可以中性化掉很多风险),来获得多头部分相对空头部分的超额收益。...同时,量化模型应该对这些噪音进行中性化处理,即使无法中性化掉,那也应该在风险层面去控制。噪音的冲击往往会带来阶段性的亏损,但噪音之后的均值回归又会给量化策略带来可观的收益。...最后的组合也会完全的进行市值行业中性化处理。 拥抱新的工具,有限度且克制的使用GA因子 GA本身其实并不是一个新的事物。基于十多年GA算法的研究经验,我们非常克制且有限度的使用GA算法进行因子挖掘。

30140

从零开始学量化(五):用Python做回归

回归作为数据分析中非常重要的一种方法,在量化中的应用也很多,从最简单的因子中性化到估计因子收益率,以及整个Barra框架,都是以回归为基础,本文总结各种回归方法以及python实现的代码。...使用这种方法最重要的点是回归必须是靠谱的,比如ROE应该是稳定的,确保未来可持续,比如应想办法消除行业间的差异等等。 ? ?...带约束的最小二乘法在量化中非常常用,比如做行业中性化时,如果所有行业虚拟变量都保留,并且添加了截距项的情况下,会出现变量多重共线性,回归结果无效,这时候一种方法是删除一个虚拟变量,还有一种方法是添加一个约束...比如可以添加行业的市值占比和系数乘积的和为0: ?...其中,w为各行业流通市值占比,这种方法下,对pb因子做中性化的代码如下 from statsmodels.sandbox.rls import * weights = datas.mktcap.groupby

7.5K31

【中国市场】2018第二季度因子表现,我都惊呆了!

数据获取与处理 对原始数据进行了剔除停牌、ST、新上市、缺失值处理,同时做了去极值、标准化,中性化处理。 原始数据与处理后的数据分布对比 ?...因子定义 价值因子 | 收益因子 | 成长因子 | 质量因子 规模因子 | 波动因子 | 动量因子 具体每个大类下的小类因子定义,在文末查询 因子结果分析 风格因子表现 (前50%) 1个月 - 行业中性...风格因子表现 (前50%) 3个月 - 行业中性(A股、B股、H股) ? 风格因子表现 (前50%) 6个月 - 行业中性(A股、B股、H股) ?...风格因子表现 (前50%) 年初至今 - 行业中性(A股、B股、H股) ? 风格因子表现 (前50%) 1年 - 行业中性(A股、B股、H股) ?...风格因子表现 (前50%) 3年年化 - 行业中性(A股、B股、H股) ? 风格因子表现 (前50%) 5年年化 - 行业中性(A股、B股、H股) ?

61130

单因子测试(下)——回归测试法

---- 因子预处理 与分层测试法不同,回归法测试时,因子可以不进行中性化处理,只进行异常值处理和标准化(zscore)处理,将中性化的过程包含在测试过程中。...方法说明 每一期,对全样本做一次回归,回归时将本期到下一期的股票收益率作为因变量,当期的因子暴露值作为自变量,同时考虑到市值中性和行业中性,加入行业虚拟变量和市值变量作为自变量,市值变量可以取对数消除量纲...一些细节 包含行业虚拟变量的回归中,如果再加有截距项,就会导致完全共线性,因此回归前必须进行处理,大概有这么几种方法:不加截距项(如上方程);加截距项,但将其中一个行业变量的暴露值全部设为0或者删除,消除共线性

5.5K12

收藏级!A股动态多因子模型实践

公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。...所有因子数据都经过了以下处理: 行业中性化,采用中信一级行业,对每个因子计算行业内Z-Score的方式计算中性化后的因子值。...异常值处理,也在行业内进行异常值处理,异常值的判定标准为超过正负3个标准差。...组合优化 基于以上各模型计算每个股票的因子得分和因子权重,然后基于以下目标函数(最大化Alpha因子)及限制条件(主要包括行业暴露、主动权重及行业市值限制)求解股票权重: (i) industry constraint

1.3K20
领券