information anslysis适用于分析评价在不考虑交易成本下,一个factor的预测能力的一种方法。主要的方法就是通过因子的IC来分析。
衡量一个因子的好坏还有一个指标,就是稳定性。因子的稳定性直接决定了你的调仓频率。
广告:本人的单因子测试视频教程 https://study.163.com/course/introduction/1005568012.htm
上次,我们利用get_clean_factor_and_forward_returns这个函数,可以获得alphalens能够接受的一种factor数据,接下来,我们就是利用这个函数返回给我们的数据去进行因子的分析。我们队这个函数的返回值命名为factor_data,即factor_date = get_clean_factor_and_forward_returns(......)。
相比于alphalens,pyfolio使用起来要简单很多。安装与alphalens一样,直接pip就可以了。数据也很简单,基本在国内使用的话,用于benchmark不可能让pyfolio自己去获取,所以,最简单的demo中,只需要我们的portfolio的daily return与benchmark的daily return就可以了。
SignalFactorAnalyse单因子测试框架哪些因子可以为组合提供超额收益?这是构建多因子模型的第一步,也是最关键一步。 特征选择非常关键,只有把握关键特征才能对数据达到重要性认识,选择好的因子,才能获取超额收益率。 对于传统交易经验、金融理论、微观市场、机器学习、深度学习等不断挖掘出来的巨量待验因子,一个快速且有效的因子测试框架,将是Multi-factor策略系统中最为关键的一环。 因子模型测试思路 因子有效性的判断与筛选: •备选因子确定: 数学意义、经济意义、统计意义 •预处理: 数据空缺与
之前看到过一篇文章,讲的就是如何在使用pandas的时候降低内存的开销。笔者亲自尝试了一下,发现确实不错,但是也会有很多问题,譬如,一些第三方包(例如statsmodels、alphalens等)的运算要求数据就是float64类型的,这使得我们很尴尬呀。
我们详细分析对比了采用不同情绪得分计算方法的因子表现。从而得出一个很重要且结论:即情绪因子构建时应该考虑新闻与股票的相关度即情绪得分的时间衰减。基于以上的结论,在本篇推文中,我们主要基于中证800指数的成分股,测试新闻情绪因子在这些成份股中的具体表现。报告的第一部分我们会对从各个维度对新闻情绪数据进行统计,第二部分主要对基于日度的新闻情绪因子进行测试及对比。
在交易中的机器学习模型通常针对历史股价和其他定量数据进行训练,以预测未来股价。然而,自然语言处理(NLP)可以帮助我们分析财务报表,如10-k表,以预测股票走势。10-k表是公司提交的年度报告,提供对其财务业绩的全面总结(这些报告是由证券交易委员会授权的)。对投资者来说,梳理这些报告常常是冗长乏味的。通过情绪分析(自然语言处理的一个子领域),投资者可以迅速了解报告的语气是积极的、消极等等。在10-k表中表达的整体情绪可以用来帮助投资者决定他们是否应该投资该公司。
本贴接着上贴〖Quantopian 入门系列二 - 流水线 (上)〗的内容,讨论下面目录的 5- 8 节:
领取专属 10元无门槛券
手把手带您无忧上云