(《The Economist》 杂志五月第一期封面 )
《经济学人》五月第一期杂志中,头条新闻中将数据比作世界上最有价值的资源。早在2014年马云董事长就说过阿里巴巴从本质上来讲已经成为一家数据公司。文章[4]中说现在连GE、西门子等工业巨头也开始称自己是一家数据公司了。但文章[4]中也提出需要削弱在线服务供应商对数据的掌控力,让提供数据的一方拥有更大的控制权。这自然就提到一个问题,数据应该为谁而用?数据既然是世界上最有价值的资源,而大多又是由个人客户提供的,那自然应该也为客户所用,而不应只是用于那些拥有数据的公司提升市值,做各样的数据化运营等。
但如何为客户所用?如此多的数据,只有大型的具有云计算平台的公司才能处理。而那些大数据处理所需的技术也不是普通客户所能掌握的。通过更人性化的交互接口,如智能助理,将用户的需求转换为机器学习、大数据所处理的问题是一个不错的途径。以下将以基于金融知识图谱的智能问答为例探讨该途径。
国内的股票市场,一般认为是更加倾向于主题投资而不是基本面、价值投资的市场,原因之一是散户贡献了大部分成交量。在这个信息爆炸的时代,如《信号与噪声》[2]书中描述的大多数数据都只是噪声,人们很难从干扰他们的噪声中分辨出有用的有效的投资信号。在国内证券市场也是如此,更有甚者,有些专业的市场参与者还利用这点进行炒作。
如何为个人客户处理证券市场的纷繁信息,这其实是智能助理的中的第一步的信息收集处理的要求。[5]所以一方面,我们用金融市场相关数据构建知识库;另外一方面,为了更好的人机交互,用 NLP深度学习模型对客户问题进行处理。模型包括问答产生式模型(sequence-to-sequence)、语义相似度计算(word/sentence embedding)、语言理解(LSTM实体标注)等[6]。将两者结合也就有基于金融知识图谱的智能问答功能:
一、 目前实现的一期的证券市场金融知识图谱以上市公司为核心,关联相关行业、概念等信息。客户可以询问股票、行业、基金的重仓概念板块、股权关系等问题。
(图片来源文章[7])
二、国内证券市场受市场情绪比较重,在大数据时代,舆情因子是专业投资机构一直在研究的方向之一,所以也为广大的普通投资者提供上市公司分析师评级与舆情信息。
(图片来源文章[7])
三、结合专业的金融量化多因子基本面研究,将上市公司信息按以下公司基本面复合因子组合进行排名,客户可以查询行业、概念板块下指定财务估值、财务成长、舆情公司排名情况。而且之后,客户还可以根据自己的偏好自定义因子进行排名。
可以看出,目前还是以公司财务指标为主,财务的初衷是了解企业的财务状况、经营成果和现金流量等方面情况。但正如吴晓波老师说过的“你永远无法从财务报表中读懂一家互联网公司。”那些过滤了公司方方面面信息的财务信息,在这个日新月异的时代,早已不能合适的刻画公司经营情况,更何况互联网+还改变了很多行业、公司的原有商业模式。之后我们将继续完善这些企业可量化指标、包括结合大数据根据不同行业逻辑构建的因子等。
那这些公司信息因子排序能代表真实投资价值吗? 当然不行。对于公司基本面信息,以前往往只有专业的投资人会去分析这些数据。在人工智能的帮助下,将这些分析能力已问答的形式提供给广大普通投资者,让数据为个人客户所用,从而帮助个人投资者更方便的构建自己的理性投资。
结论:
结合金融知识图谱和基于深度学习自然语言处理模型帮客户处理纷繁复杂的证券市场信息,为的是让数据为个人客户所用。这条路很长,目前只走了一小步,欢迎探讨。
参考文献:
[1] 郝伯特·西蒙. 现代决策理论的基石[M]. 北京经济学院出版社.1989.
[2] 纳特•西尔弗.信号与噪声:大数据时代预测的科学与艺术 [M].中信出版社.2013,9.
[3] 袁峻峰. 结合AlphaGo算法和大数据的量化基本面分析法探讨[OL].大数据文摘.2016-11-25.
[4] The world's most valuable resource[N].The Economist.2017.5.
[5] 袁峻峰. 需要什么样的智能助理,是《棋魂》中的佐为还是蜡笔小新?
[OL]. 机器之心. 2017-01-12.
[6] 张家兴. 由金融服务中的智能机器人技术引发的种种思考[OL].云栖社区.2016.09.
[7] 袁峻峰. AI与理性投资—基于金融知识图谱的智能问答[OL]. 蚂蚁金服评论. 2017-06-13.
作者简介
袁峻峰,花名观妙,蚂蚁金服人工智能部,复旦金融学硕士,FRM金融风险管理师。10年以上从事金融IT相关领域工作经验,包括国内银行间市场金融产品(包括衍生产品)的量化分析、市场风险管理以及相关系统实现等。目前从事并关注于金融知识图谱、大数据、机器学习在证券投资方面相关主题与应用,欢迎探讨, 邮箱yuanjunfeng_fr@163.com , 微信 jake-80 。
END
投稿和反馈请发邮件至holly0801@163.com。转载大数据公众号文章,请向原文作者申请授权,否则产生的任何版权纠纷与大数据无关。