专栏首页量化投资与机器学习Man Group:另类数据在中国!

Man Group:另类数据在中国!

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。

作为一家全球顶级的对冲基金,Man Group在人才、算力、数据等方面投入极多,这也为期优异的业绩与持续增长的规模添砖加瓦。

我们看到截止目前,Man Group在全球对冲基金AUM排名中暂列第二,马上突破1000亿美元!

图片来自:公众号独家制作

另类数据就是未来!

Citadel前量化分析师Jeffrey Ryan在媒体上所说:“在量化基金在分析来自社交媒体的实时数据时,处理庞大的非结构化数据集变得越来越重要!”

另类数据更多的应用于偏股票型的量化对冲基金。近于实时的另类数据流有助资产管理公司提前获得大量股票买入或卖出的信号。除此之外,传统资产管理公司也已经开始使用另类数据来帮助提升人工制定长期投资决策的质量。例如,英国资产管理公司Schroders在2014年推出了一个“数据洞察部门”(Data Insights Unit,以下简称“DIU”)。DIU拥有30名数据科学家,他们分析各种另类数据,帮助投资组合管理团队制定中长期投资决策。

欧美市场也正在形成包括使用另类数据的资产管理经理、数据所有者和供应商的另类数据生态系统。例如,Orbital Insights和Prattle两家另类数据供应商,前者利用卫星图像估计原油库存,后者根据文本数据定量分析主要国家货币政策情绪。

从数据积累方面看

根据 IDC 的一份报告,2018 年全球有 33ZB 的数据,而这个数量预计在 2025 年会增长到 175ZB,这依赖于计算机算力的提升和存储设备技术的提高。

从另类数据公司数量上看

另类数据公司主要分为三类。一是原始数据提供者,这类供应商只收集最原始的另类数据,对于数据的处理程度最小;二是轻处理数据提供者,提供与金融资产相关的可视化数据;三是信号提供者,一般关注于某个特定行业,向资产管理公司提供打包好的量化投资信号。

今天,Man Group对其在中国另类数据的使用上谈了几点自己的心得,事实表明:中国的另类数据具有独特的优势,是海外数据不可替代与比拟的。如何发挥效益,如何保证数据安全,这是我们每个人需要思考的!

中国市场

Man Group在对中国另类数据市场的规模评价为三个字:Big!Big!Bigger!

自2015年以来,中国大数据市场的规模增长了近600%(下图所示)。

图片来自:Man Group

同时,与中国相关的另类数据厂商的数量在过去几年也在快速增长(下图所示)。

图片来自:Man Group

以下是公众号整理的部分在量化投资领域有应用场景的另类数据厂商:

根据IDC的一份报告显示,2018年全球有33ZB的数据,而这个数量预计在2025年会增长到175ZB。AlternativeData的数据也印证了这一点,2018年全球另类数据公司已增长到近400家,国内另类数据厂商大约占100家。目前中国已经超过了200家。

从市场空间上看,AlternativeData统计表明,截至2017年全球已有约800支基金利用另类数据做投资决策,2017年投资机构对另类数据的投入规模约为4亿美金,行业正处于快速发展期。预计从2021年开始到未来的10年期间,国内每年新成立另类数据厂商可达几十家乃至100家,每年吸引投资达数十亿人民币。

数据也要入乡随俗

同时,投资者需要理解哪些数据具有预测能力。13亿中国消费者不像西方消费者那样通过谷歌、Twitter或Wallstreetbets来产生数据。相反,他们在很多社交软件、流媒体等平台产生大量的数据:

图片来自:Man Group

比如:天猫数据显示了中国消费者如何从耐克、阿迪达斯等国际品牌,转向安踏、李宁等国内品牌。这种现象是无法通过全球消费者相关数据获得的。

图片来自:Man Group

同样,通过使用中国本土的另类数据,可以有效地监测整个行业的趋势。例如:我们使用来自携程和去哪儿的日活跃用户数量、用户在APP上的总时间以及每个用户所花的时间。正如我们所预料的,随着新冠疫情的出现,其APP使用量急剧下降。透过此类数据,投资者能够观察到中国消费者对旅游的兴趣保持到何种程度,来配合相应的对策。

图片来自:Man Group

图片来自:Man Group

目前国内使用另类数据的多为对冲基金、二级市场基金及部分一级市场基金

买方对另类数据的使用方式:

图片来自:中信证券

另类数据可以给基金经理带来五点优势:

  • 更大体量的数据和信息
  • 新的洞察力
  • 竞争优势
  • 可靠性
  • 效率

虽然基金经理使用另类数据寻找到新的阿尔法只是时间问题,但并不是所有另类数据都有潜力可以帮助基金公司获取市场阿尔法,因此另类数据公司在收集、清洗数据的同时,需要基金经理来评判数据是否有价值,同时高效的处理和应用将是降低成本和提升效率的关键,因此另类数据公司应当具备机器学习等技术开发能力和高效的产品策略

同时,Man Group对有效处理数据,对相关人士/机构提出了四个考虑因素:本土文化、语言技能、当地供应商、地方监管。

Man Group也教育相关投资者:

为了更好地使用和挖掘中国本土的这些另类数据,投资者应该设法调整他们研究框架与流程。同时,最好与当地另类数据商合作,并关注那些不熟悉但很受欢迎的网站,而不是那些在全球常见的网站。最后,要确保技术团队和研究人员能够处理这些新数据的细微差别。

总结一句话:数据也要入乡随俗,用起来才能得心应手!

最后

另类数据让我们感到充满了希望和创造力,但许多人拿”淘金热“作比喻——销售工具可能比寻找黄金本身更有利可图。

在许多对冲基金中,数据来源/采购是一项新的工作职能,它帮助数据供应商了解量化需求,并为大规模的量化研究细化数据。

很多量化机构在招聘岗位市,也都在寻找类似的人才:

数据的内涵与外延在不断变化,分析人员的思维不能停留在传统数据的舒适圈中,必须与时俱进,保持开放。而目前,我们的时代也许正处于这一轮变革浪潮的高潮。

最后:

“Most problems don’t require more data. They require more insight, more innovation and better eyes. Information is what we call it when a human being takes data and turns it into a useful truth.”

- Seth Godin

”大多数问题无需大量的数据。它们需要更多的洞察力,更多的创新性和一双慧眼。当人类获取数据并将其转化为有用的真理时,我们称之为信息。“

本文分享自微信公众号 - 量化投资与机器学习(Lhtz_Jqxx),作者:QIML编辑部

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AkShare-另类数据-福布斯中国榜单

    数据科学实战
  • 另类大数据:中国有嘻哈的rapper们都在唱些什么?

    2017年下半年,钱多、戏多、话题多的《中国有嘻哈》突然带火了一众rapper,原来格格不入的嘻哈音乐突然变成了主流。数据统计显示,截至9月7日,《中国有嘻哈》...

    挖掘大数据
  • 对话Man Group:对冲基金的达尔文式竞争

    如果你对算法交易,对冲基金,大数据感兴趣,那么,今天的推文你一定会感兴趣。Man Group首席执行官Luke Ellis做客《Masters in Busin...

    量化投资与机器学习微信公众号
  • 最新!全球顶级对冲基金持仓公布,文艺复兴规模超1600亿美元

    公众号根据全球各地对冲基金公司向美国证监会(SEC)提交了其13F报告。对其持仓做了全面的分析。所有数据都是根据最新编写。希望大家有所收获!

    量化投资与机器学习微信公众号
  • 盘点全球顶尖的13家对冲基金

    根据HFR和BarclayHedge的数据,截止2019年6月,全球约有15000家对冲基金,管理资产超过3万亿美元(不包括母基金资产)。美国是对冲基金行业的主...

    点滴科技资讯
  • 这场举世瞩目的人工智能听证会,让华尔街何去何从?

    今天的这篇文章想说的太多太多,那就让我们从Marcos Lopez de Prado说起吧!

    量化投资与机器学习微信公众号
  • 另类数据:不会用不代表不好用!

    管理着1040亿美元的对冲基金Man Group的数据科学主管Hinesh Kalian表示:“在过去6个月,我们对另类数据的需求飙升,越来越多的另类数据提供商...

    量化投资与机器学习微信公众号
  • 【腾讯云的1001种玩法】AMH 4.2 升级Nginx与PHP实战练习与笔记

    最近对AMH的系统比较感兴趣,特拿来了AMH 4.2来尝试下对其内核版本升级一下,并做了笔记供需要的同学参考。前几天在对张宁网进行更新改版,配置SSL的时候碰见...

    ZNing
  • R语言ggmap空间可视化机动车碰撞–街道地图热力图

    在本文中,我将创建纽约市机动车碰撞的市镇级热图。数据来自纽约市数据。特别是,我将从镇级碰撞到街道级碰撞。在下面,我加载ggmap包和数据。

    拓端
  • Python笔记:Pydantic库简介

    通过pydantic库,我们可以更为规范地定义和使用数据接口,这对于大型项目的开发将会更为友好。

    codename_cys
  • Linux 权限控制的基本原理

    以下是对用户和组信息的举例。 /etc/shadow 中的口令信息为加密存储,不举例。

    小小科
  • Python 学习之正则表达式「下」

    re.sub(pattern, repl, string, count, flags=0) 与 re.subn(…) repl 用来替换的字符串,strin...

    Python技术与生活认知的分享
  • “快餐”不是VR游戏的全部,人文关怀我们同样注重

    VRPinea
  • 利用lynis如何进行linux漏洞扫描详解

    lynis 是一款运行在 Unix/Linux 平台上的基于主机的、开源的安全审计软件。Lynis是针对Unix/Linux的安全检查工具,可以发现潜在的安全威...

    砸漏
  • sshfs 文件系统权限的一点笔记

    sshfs 是基于ssh的一个工具,用于挂载远端的文件系统到本地. 只要可以用ssh方式访问远端,那么就可以用sshfs 这个工具把有权限的目录挂载到本地来. ...

    qsjs
  • Android开发笔记(九十三)装饰模式

    装饰模式是扩展功能用的一种设计模式, 一般要扩展功能,我们都会想到继承,可是继承只能继承一个基类,如果有多个条件需要分别进行扩展,那得写好几个派生类,条件...

    用户4464237
  • 鸟哥的Linux私房菜笔记第五章,文件权限与目录配置(一)

    Linux系统分使用者、群组、其他人的三种身份,权限就是根据这三种身份进行分配的。

    Johnson木木
  • 每日两题 T6

    在一个 8 x 8 的棋盘上,有一个白色车(rook)。也可能有空方块,白色的象(bishop)和黑色的卒(pawn)。它们分别以字符 “R”,“.”,“B” ...

    合一大师
  • Linux常用命令——文件搜索命令

    所有命令都可以使用--help选项获取命令常用选项 Linu中文件以1开头的文件为命令的帮助文件,5开头的为配置文件的帮助

    喝茶去

扫码关注云+社区

领取腾讯云代金券