专栏首页量化投资与机器学习高清『无码』!因子模型与机器学习

高清『无码』!因子模型与机器学习

量化投资与机器学习公众号独家解读 量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。

公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章,愿与你共同进步!

今天跟大家分享一篇机器学习用于因子模型的论文,一句话概括文章的内容:

作者首先利用了几类机器学习的模型对多个因子进行降维(或者称为特征提取),再利用处理后的因子结合组合优化Minimum-Variance的框架进行组合构建。

首先,对原始因子处理的模型使用了以下五大类,只有第5种是跟深度学习相关的,为了行文一致性,我们后文都称为机器学习模型。

  • Principal component analysis
  • Sparse principal component analysis
  • Partial least squares
  • Sparse partial least squares
  • Autoencoders

利用以上机器学习模型对因子进行处理后,通过时间序列线性回归计算出因子暴露及特质收益项,再分别得出因子收益的协方差矩阵及特质收益矩阵,并通过这两个风险矩阵结合组合优化模型确定组合权重。

文章内容本身很长,但作者利用滚动窗口把数据分为Training、Validation及Out of Sample,并结合基于Minimum-Variance的损失函数,这个整体的框架及步骤很有借鉴意义。这里把整个框架的步骤梳理出来跟大家分享,其他实证性的内容,请大家参考原论文。

需要注意的是,作者在文中采用的是基于时序的因子模型,也就是说,因子收益是已知的,如Fama-French的因子,因子本身代表组合的收益率。并不是如Barra体系下,截面回归中的因子暴露。所以回归时,求解的是因子暴露。

通过Training的数据求出因子暴露,并利用Training得到的因子暴露、截距及对应的机器学习模型参数,应用到验证数据中求得的风险矩阵。

将验证数据中求得的风险矩阵,放到损失函数里,得到一组参数使用损失函数最小。这里的创新点就是巧妙的结合了训练数据与验证数据及损失函数。这正是我们可以借鉴的部分。

本文分享自微信公众号 - 量化投资与机器学习(Lhtz_Jqxx),作者:QIML编辑部

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【机器学习】贝叶斯机器学习:经典模型与代码实现

    贝叶斯定理是概率模型中最著名的理论之一,在机器学习中也有着广泛的应用。基于贝叶斯理论常用的机器学习概率模型包括朴素贝叶斯和贝叶斯网络。本章在对贝叶斯理论进行简介...

    黄博的机器学习圈子
  • 机器学习day15高斯混合模型

    高斯混合模型(Gaussian Mixed Model,GMM)也是常见的聚类算法。使用EM算法进行迭代计算。高斯混合模型假设了每个簇的数据符合正态分布(高斯分...

    rare0502
  • 机器学习集成学习与模型融合!

    对比过kaggle比赛上面的top10的模型,除了深度学习以外的模型基本上都是集成学习的产物。集成学习可谓是上分大杀器,今天就跟大家分享在Kaggle或者阿里天...

    Datawhale
  • 机器学习模型与传统机理模型的融合

    基于物理过程的各种数学模型在水力、市政、海洋等领域已经得到了很多年的发展和应用,随着这几年机器学习技术的大热,也有越来越多的人尝试将机器学习技术应用在水力、市政...

    企鹅号小编
  • 机器学习模型,能分清川菜和湘菜吗?

    一个地区的文化和当地的特色食物总是分不开关系,可以说小到村庄,大到国家,每个地方都有自己的“味道”。

    机器学习算法工程师
  • 机器学习(5) -- 模型评估与选择

    Content   6. 学习模型的评估与选择     6.1 如何调试学习算法     6.2 评估假设函数(Evaluating a hypothesis)...

    昱良
  • 生信代码:机器学习-训练模型

    在构建预测模型的开始可以使用数据分割构建训练集和测试集,也可以在训练集中用于执行交叉验证或自举(bootstrapping),以评估模型。

    科研菌
  • 《机器学习》学习笔记(二)——模型评估与选择

    错误率(error rate):分类错误的样本占样本总数的比例 精度(accuracy):1 - 错误率误差(error):学习器的实际预测输出与样本的真实输...

    荣仔_最靓的仔
  • 机器学习中算法与模型的区别

    机器学习涉及到机器学习算法和模型的使用。对于初学者来说,这很容易让人混淆,因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢,还是不一...

    代码医生工作室
  • 机器学习模型调参指南(附代码)

    ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。

    统计学家
  • 机器学习之决策树与随机森林模型

    本文用容易理解的语言和例子来解释了决策树三种常见的算法及其优劣、随机森林的含义,相信能帮助初学者真正地理解相关知识。

    汪毅雄
  • 机器学习22:概率图--EM算法与GMM(高斯混合模型)

    EM算法(Expectation Maximization Algorithm, 最大期望算法)是一种迭代类型的算法,是一种在概率模型中寻找参数最大似然估计...

    用户5473628
  • 机器学习20:聚类(k-means模型、高斯混合聚类模型)

    在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据内在的性质及规律,其中,应用最广的是聚类算法。

    用户5473628
  • 比Keras更好用的机器学习“模型包”:无需预处理,0代码上手做模型

    一位毕业于哥廷根大学、做机器学习的小哥也发现了这个问题:原本只是想设计个模型,结果“实现比设计还麻烦”。

    量子位
  • 深入机器学习系列12-高斯混合模型

    高斯混合模型   现有的高斯模型有单高斯模型()和高斯混合模型()两种。从几何上讲,单高斯分布模型在二维空间上近似于椭圆,在三维空间上近似于椭球。在很多情况下,...

    企鹅号小编
  • 深入机器学习系列之:高斯混合模型

    现有的高斯模型有单高斯模型(SGM)和高斯混合模型(GMM)两种。从几何上讲,单高斯分布模型在二维空间上近似于椭圆,在三维空间上近似于椭球。 在很多情况下,属于...

    数据猿
  • 《机器学习》笔记-模型评估与选择(2)

    作者:刘才权 编辑:赵一帆 写在最前面 如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好奇,...

    机器学习算法工程师
  • 《机器学习》-- 第二章:模型评估与选择

    (1) 误差:学习器的实际预测输出与样本的真实输出之间的差异;其中学习器在训练集上的误差称为”训练误差“(training error),在新样本上的误差称为”...

    fireWang
  • 机器学习14:模型评估与性能提升

    6.2,验证曲线、学习曲线、ROC曲线、准确度、精确率、召回率、F1_Score

    用户5473628

扫码关注云+社区

领取腾讯云代金券