专栏首页量化投资与机器学习供应链数据因子化研究:Customer Momentum

供应链数据因子化研究:Customer Momentum

量化投资与机器学习公众号独家解读

量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。

公众号遴选了各大期刊最新论文,按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章,愿与你共同进步!

第一期 | 第二期 | 第三期 | 第四期 | 第五期 | 第六期

本期遴选论文 来源:The Journal of Portfolio Management August 2021 作者:Rei Yamamoto, Naoya Kawadai, and Hiroki Miyahara 标题:Momentum Information Propagation through Global Supply Chain Networks

核心观点

  • 全球供应链数据中存在显著的Alpha信息
  • 可以基于图论中的Edge Betweeness Centrality作为Customer Momentum计算时的权重,其与销售占比存在显著正相关性。
  • 考虑更多层的客户,采用更长时间的动量,能够显著提高Customer Momentum因子的表现。

供应链数据主要包含某家公司的供应商及客户的信息,公开信息中,可以获取某家公司供应链信息的主要来源包括:

  • 上市公司披露的财务报告,其中包括主要供应商及客户的名单
  • 招投标数据
  • 新闻
  • 航运数据

把所有公司的供应商及客户的数据整合在一起,就得到了供应链网络图谱数据。供应链数据在量化投资,特别是因子化的应用中,学术界最早可以追溯到Cohen和Frazzini(2008),他们发现客户的股票价格的变动会影响供应商的股票价格。随后在Chen, Gao和Zhang(2019)基于美国供应商和中国客户之间的研究,也验证了这类现象,并取得了不错的策略表现。

总结过去多年的研究方法,关于供应链数据在量化中的应用,主要有以下几个方面:

  • 股票价格的传导,比如Customer Momentum研究的是客户价格变动对供应商的影响;Supplier Momentum研究的是供应商价格变动对于客户股票价格的影响。
  • 下游经营情况对于上游股价的影响,比如客户的收入增长对于供应商股价的影响。

但总体而言,研究Customer Momentum,且发现明显传导效果的研究成果比较多,在Customer Momentum研究的过程中,还有许多值得考虑的问题:

  • 多长时间的动量?过去一个月,还是过去一年?
  • 不同客户的动量怎么加权?等权?还是按销售占比加权。如果按销售占比加权,遇到没有具体销售数额时怎么处理?Ahern(2013)把应用图论的中心度作为销售占比的代理变量,取得的显著的效果。
  • 是否考虑客户的客户?大部分研究中,只考虑直接关联的客户。但Yoshino(2020)发现客户的客户对于供应商的股价也存在显著的影响。

以上的问题,作者在文章中,基于Facset全球产业链数据,都做了详细的实证研究。我们首先来了解下数据。

供应链网络数据

作者采用2003年4月至2019年12月,FacSet供应链数据,该数据库总共有76000家供应商、120000家客户、总计140000多条供应链关系。值得注意的是,该供应链数据只有关系确定的时间点,并没有关系结束的时间点。图1给出了2019年12月Toyota相关的部分供应链数据。最后一列是销售额占比,大部分是空值,只有9%的数据有具体的销售占比。

下图2,作者基于GICS行业分类,做了一个各行业间供应链关系的网络图,图中圆圈的大小表示行业公司数量,连线的粗细表示行业间供应链关系的多少。

图3展示了历年数据中的供应链关系的数量及销售占比不为空的比率。

Customer Momentum

客户动量因子,主要研究的是客户的股价变动对于供应商股价的影响,所以在每个换仓时间点,需要计算每个股票作为供应商,其所有客户在过去一段时间的加权收益率。最简单的Customer Momentum计算方法如下,见Cohen和Frazzini(2008):

\mathrm{cmom}_{i}^{1 M}=\sum_{j=1}^{N_{i}} w_{i j}^{\text {sales }} \mathrm{mom}_{j}^{1 M}, i=1,2, \ldots, N

其中 为 的客户 过去一个月收益率, 为销售占比。

但由于销售占比数据的缺失,基于上面的方法并不能有效的计算Customer Momentum,所以Hamuro和Okada(2018)想到了基于图网络的边中介中心度(Edge Betweeness Centrality)计算权重:

\mathrm{cmom}_{i}^{1 M}=\sum_{j=1}^{N_{i}} w_{i j}^{\text {centrality }} \mathrm{mom}_{j}^{1 M}, i=1,2, \ldots, N

其中

w_{i j}^{\text {centrality }}=c_{i j} / \sum_{j=1}^{N_{i}} c_{i j}, i=1,2, \ldots, N

上式中 为 边的中介中心度。

Edge betweenness centrality 是一个图或网络中经过某条边的最短路径的数量。Python中的NetworkX可以很方便的计算该数值。

之前的大部分研究,都只讨论了供应商直接关联的客户(第一层)的Customer Momentum,但Yoshino等(2020)发现,客户的客户,甚至递进了多层关系的客户,对供应商的股价仍有影响。如上图4,左边是单层客户关系,右边是两层客户关系。所以当我们考虑多层(L层)客户关系后,上式就变为:

\mathrm{cmom}_{i}^{T M}=\sum_{l=1}^{L} \sum_{(m, n) \in G_{\mathbb{u}}} w_{m n}^{\text {centralily }} \mathrm{mom}_{n}^{T M}, i=1,2, \ldots, N
w_{m n}^{\text {centrally }}=c_{m n} / \sum_{l=1}^{L} \sum_{(m, n) \in G_{1 .}} c_{m n}

实证结果

作者使用了月度的供应链数据,其中不仅包括当月存续的供应链关系,还包括一年内结束的供应链关系,因为即使供应链关系已经结束,其影响还在。股票池选取的是MSCI发达国家指数,包括了23个国家,近3000只股票。

覆盖度统计

从图5可以看出,2004年,供应链数据能覆盖平均大概40%的股票,平均市值占比为70%。到了2019年覆盖度达到了90%左右。图6展示了不同行业的所有时间段的平均覆盖度,及2019年的覆盖度。

作者将所有股票按Edge Betweeness Centrality分成了5组,如图9所示,Mean为每组销售占比的均值,可以看出,Edge Betweeness Centrality与销售占比间存在明显的正相关性。这个结果给我们用Edge Betweeness Centrality作为权重提供了依据。

表10给出了不同T与Layer取值下,因子的自相关性,自相关性越高说明因子换手越小,比如第一行第一列,表示计算Customer Momentum用过去一个月的收益率,且只用直接关联的客户,这样因子的自相关性为0,说明因子换手非常高。

测试结果

针对MSCI发达国家指数成分股,基于Customer Momentum分为五组,做多Top组,做空Bottom组,月度调仓。下表12给出了测试结果:

  • 其中T表示Customer Momentum计算时采用的不同的时间长度,比如T=1,表示在等式5中采用过去1个月的收益率。
  • Layer表示等式5中的L,例如Layer为5时,表示考虑了5层的供应链关系。
  • mom列是标准的动量因子(前12个月收益)多空测试的结果
  • 第一行至第三行分别为多空策略的年化收益、年化标准差及夏普比率
  • 第四行之后,是把收益与Fama因子回归后的结果,回归等式如下等式7所示:
r_{t}=\alpha+\beta^{M k T} r_{t}^{M K T}+\beta^{S M B} r_{t}^{\mathrm{sMB}}+\beta^{\mathrm{HML}} r_{t}^{\mathrm{HML}}+\beta^{\mathrm{WM} L} r_{\mathrm{t}}^{\mathrm{wML}}+\varepsilon_{t}, t=1,2, \ldots

基于上表有以下发现:

  • 与标准的动量策略相比,同样基于过去12个月收益的Customer Momentum因子效果更好(T=12,Layer=1)
  • 对所有的T,夏普比率基本随着Layer的增加而升高,基本在Layer为3达到最大。说明相对于只考虑直接的客户,客户的客户能带来更多的增量信息
  • T=1与T=12的结果,相对更优,但如果考虑到换手率,T=12的效果更优。

下图13给出了T=12,Layer=3的累计收益曲线图,年化收益4.44%,夏普比率0.81。

下表14展示了在美国、欧洲及日本市场分别测试的结果,整体而言,在各个市场,T=12的效果均优于T=1。

总结

供应链数据、产业链数据等越来越多样化的另类数据,正成为量化投资机构新关注的焦点,从逻辑出发,结合新兴的算法模型,将为Alpha的挖掘提供更多的可能性。

参考文献(给出原文的参考文献,以供进行更深入的研究)

Chen, R., Z. Gao, and X. Zhang. 2019. “Return Predictability: Evidence from the US-China Supply Chain.” The Journal of Portfolio Management 45 (4): 143–151.

Cohen, L., and A. Frazzini. 2008. “Economic Links and Predictable Returns.” Journal of Finance 63 (4): 1977–2011.

Dai, R., L. Ng, and N. Zaiats. 2020. “Short Seller Attention.” SSRN, 2020.

Douglass, M. “Measuring Properties of Dynamic Customer-Supplier Networks.” Working paper, Stanford University, 2017.

Fama, E. F., and K. R. French. 1993. “Common Risk Factors in the Returns on Stocks and Bonds.”Journal of Financial Economics 33 (1): 3–56.

Gofman, M., G. Segal, and Y. Wu. 2020. “Production Networks and Stock Returns: The Role of Vertical Creative Destruction.” The Review of Financial Studies 33 (12): 5856–5905.

Grinold, R. C., and R. N. Kahn. 2011. “Breadth, Skill, and Time.” The Journal of Portfolio Management 38 (1): 18–28.

Hamuro, Y., and K. Okada. “Predicting Stock Returns Based on the Time Lag in Information Diffusion through Supply Chain Networks.” Special Interest Group on Financial Informatics Technical Reports 40–45, Japanese Society for Artificial Intelligence, 2018.

Jegadeesh, N., and S. Titman. 1993. “Returns to Buying Winners and Selling Losers: Implications for Stock Market Efficiency.” Journal of Finance 48 (1): 65–91.

Kim, D. Y., P. Zhu, W. Xiao, and Y. T. Lin. 2020. “Customer Degree Centrality and Supplier Performance: The Moderating Role of Resource Dependence.” Operations Management Research 13: 22–38.

Newman, M. Networks: An Introduction 1st ed., Oxford, UK: Oxford University Press, 2010. Paatela, A., E. Noschis, and A. P. Hameri. 2017. “Abnormal Stock Returns Using Supply Chain Momentum and Operational Financials.” The Journal of Portfolio Management 43 (2): 50–60.

Seiler, A. “Measuring Performance in Supply Chain Networks.” Ph.D. thesis, Sanford Business School, 2016.

Shahrur, H., Y. L. Becker, and D. Rosenfeld. 2010. “Return Predictability along the Supply Chain: The International Evidence.” Financial Analysts Journal 66 (3): 60–77.

Wu, L. 2015. “Centrality of the Supply Chain Network.” 2015, https://ssrn.com/abstract=2651786.

Yoshino, T., M. Morita, H. Tsuda, and T. Ohria. 2020. “Customer Momentum Strategy: Empirical Study of the Japanese Stock Market.” Securities Analysts Journal 58 (5): 63–75 (in Japanese).

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。

本文分享自微信公众号 - 量化投资与机器学习(Lhtz_Jqxx),作者:全网Quant都在看

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-06-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 另类Alpha:基于供应链数据的量化因子挖掘

    在量化交易中,如何获取适当的数据用于开发和测试交易策略,往往是投资者面临的难题。随着技术的发展,获取大数据的成本不断降低,但历史价格等传统数据已完全无法满足投资...

    量化投资与机器学习微信公众号
  • 深度学习优化入门:Momentum、RMSProp 和 Adam

    虽然局部极小值和鞍点会阻碍我们的训练,但病态曲率会减慢训练的速度,以至于从事机器学习的人可能会认为搜索已经收敛到一个次优的极小值。让我们深入了解什么是病态曲率。...

    昱良
  • 自动调优超参数:斯坦福大学提出SGD动量自调节器YellowFin

    选自Stanford University 作者:Zhang Jian等 机器之心编译 参与:李泽南、Smith 手动调整 SGD(随机梯度下降)动量(mome...

    机器之心
  • 深度学习优化入门:Momentum、RMSProp 和 Adam

    在另一篇文章中,我们讨论了随机梯度下降的具体细节,以及如何解决诸如卡在局部极小值或鞍点上的问题。在这篇文章中,我们讨论另外一个困扰神经网络训练的问题,病态曲率。...

    AI研习社
  • 价值因子的改进:结合动量的思想

    价值投资一直是投资策略的重要基石之一。现代投资之父,Benjamin Graham,也是价值投资的重要倡导者。在量化投资领域,Fama-French三因子模型中...

    量化投资与机器学习微信公众号
  • 7 papers|EMNLP 2019最佳论文;Facebook语言模型XLM-R取得SOTA结果;最优学习的85%规则

    论文 1:Specializing Word Embeddings(for Parsing)by Information Bottleneck

    机器之心
  • MoCo三部曲,自监督面试必问!

    趁着最近FAIR出了MoCov3,刚好凑够MoCo三部曲,从头捋一遍MoCo整个系列做了什么事情,探究MoCo系列为何对Self-Supervised Lear...

    灿视学长
  • 将文本特征应用于客户流失数据集

    在我的上一篇博客“什么是嵌入,你能用它做什么”中,我谈到了嵌入可以把高维、非结构化的数据转换成低维的数值表示,可以用在各种机器学习模型中。

    磐创AI
  • SAP C/4HANA到底包含哪些产品?

    2018年6月的SAPPHIRE(蓝宝石大会)上, SAP发布了新的商务软件套件:C/4HANA,意在通过SAP C/4HANA将前台应用和SAP Digita...

    Jerry Wang
  • Hello World, S/4HANA for Customer Management 1.0

    在我之前的微信公众号文章 SAP的这三款CRM解决方案,您能区分清楚么我曾经提到过我作为成都SAP研究院CRM产品开发团队的一员工作过一段时间。

    Jerry Wang
  • SAP Cloud for Customer(C4C)的一些学习资料

    1. 登录https://help.sap.com, 搜索栏里输入cloud for customer:

    Jerry Wang
  • SAP Cloud for Customer(C4C)的一些学习资料

    1. 登录https://help.sap.com, 搜索栏里输入cloud for customer:

    Jerry Wang
  • ICLR 2018 | 清华&斯坦福提出深度梯度压缩DGC,大幅降低分布式训练网络带宽需求

    选自arXiv 作者:林宇鋆、韩松等 机器之心编译 参与:刘晓坤 来自清华大学和斯坦福大学的研究者们发现,分布式随机梯度下降训练中 99.9% 的梯度交换都是冗...

    机器之心
  • Hello World, S/4HANA for Customer Management 1.0

    在我之前的微信公众号文章 SAP的这三款CRM解决方案,您能区分清楚么我曾经提到过我作为成都SAP研究院CRM产品开发团队的一员工作过一段时间。

    Jerry Wang
  • SAP成都研究院2018年总共87篇技术文章合集

    2018年很快就要结束了。Jerry在2017年年底准备开始写这个公众号时,给自己定的目标是:2018年至少保证每周发布一篇高质量的文章。如今2018年就快过去...

    Jerry Wang
  • SAP成都研究院2018年总共87篇技术文章合集

    版权声明:本文为博主汪子熙原创文章,未经博主允许不得转载。 https://jerry.bl...

    Jerry Wang
  • 面向对象编程:对象之间的关系类型

    程序你好
  • SaaS公司的高成长秘诀——聚焦“总流失率”丨双语

    T客汇官网:tikehui.com 原文作者 | Ajay Agarwal, Ben Vonwiller 编译 | 李哲 ? 衡量客户成功(Customer ...

    人称T客
  • 二阶梯度优化新崛起,超越 Adam,Transformer 只需一半迭代量

    目前,无论是从理论还是应用层面来说,机器学习中的优化都是以随机梯度下降等一阶梯度方法为主。囊括二阶梯度和/或二阶数据统计的二阶优化方法虽然理论基础更强,但受限于...

    机器之心

扫码关注云+社区

领取腾讯云代金券