学习
实践
活动
专区
工具
TVP
写文章

用图机器学习探索 A 股个股相关性变化

在本文中我们将介绍如何使用 Java 语言的图分析库 JGraphT 5 并借助绘图库 mxgraph 6 ,可视化探索 A 股的行业个股相关性随时间的变化情况。 边的权重代表边的源点和目标点所代表的两支股票所属上市公司业务上的的相似度——相似度的具体计算方法参考 7,8:取一段时间(2014 年 1 月 1 日 - 2020 年 1 月 1 日)内,个股的日收益率的时间序列相关性 这意味着距离越远的个股,两个之间的收益率相关性越低。 ——这意味着随着时间变化,这个版块内各种一直保持比较高的相关性;但有些板块(制造)的聚集性会持续变化——意味着相关性一直在发生变化。 受限于停牌、熔断、涨跌停、送转、并购、主营业务变更等情况,数据处理可能有错误,未做一一检查。 受时间所限,本文只选用了 160 个个股样本过去 6 年的数据,只采用了最小扩张树一种办法来做聚类分类。

65620
  • 广告
    关闭

    【限时特惠】腾讯云大数据产品,爆品秒杀1折起!

    移动推送、BI、云数仓Doris、ES、数据湖DLC、WeData、流计算Oceanus,多款产品助您高效挖掘数据潜力,提升数据生产力!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AkShare-股票数据-个股新闻

    作者寄语 获取个股最新的 20 条新闻文字稿内容 更新接口 "stock_news_em" # 个股新闻 个股新闻 接口: stock_news_em 目标地址: http://so.eastmoney.com /news/s 描述: 获取东方财富指定个股的新闻资讯数据 限量: 当日最近 20 条新闻资讯数据 输入参数 名称 类型 必选 描述 stock str Y stock="300059"; 股票代码 接口示例 import akshare as ak stock_news_em_df = ak.stock_news_em(stock="601318") print(stock_news_em_df) 数据示例 【经营数据】 中国平安:2020年净利1431亿元同比降4.2% e公司讯,中国平安6013182月3日晚间披露年报,公司2020年实现净利润1431亿元,同比下降4.2%。 相关报道,2021-02-03 16:33:11,http://finance.eastmoney.com/a/202102031801241590.html 601318,19股受融资客青睐 净买入超亿元

    38010

    2015年数据相关职业盘点

    2015年马上就要过去了,在这一年里,“大数据相关职业在全球就业市场的情况到底如何?我们通过WANTED Analytics和福布斯杂志刚刚公布的2015年数据为大家进行一些总结。 在对过去12个月美国就业市场“大数据相关岗位的分析中发现: 就岗位数量而言,需要“大数据”技能的岗位空缺呈现高速增长,如下图所示,其中“大数据”解决方案的销售人员、计算机系统分析师、管理分析师、IT项目经理 首先具有相关背景的本科毕业生或职业人士通过短而实用的数据分析课程,能够迅速满足相关企业的岗位空缺,因而非常抢手。 所以如果你对计算机科学感兴趣,又想在毕业后从事大数据相关岗位,你可以在本科阶段侧重于对人工智能、机器学习和数据理论的学习。 与此同时,越来越多的商学院开始开设专攻商业数据分析的本科和研究生项目,尽管不像计算机科学专业对于理工科知识有那么高的要求,但是还会 涉及一定的数据库设计、分析和编程,以及相关统计软件如Hadoop和SAS

    17620

    AkShare-股票数据-个股资金流

    作者寄语 更新个股资金流数据接口,目前该接口的历史数据只有近 100 个交易日的数据,有需要的小伙伴可以每日自行存储。 更新接口 "stock_individual_fund_flow" # 个股资金流 个股资金流 接口: stock_individual_fund_flow 目标地址: http://data.eastmoney.com /zjlx/detail.html 描述: 获取东方财富网-数据中心-个股资金流向 限量: 单次获取指定市场和股票的近 100 个交易日的资金流数据 输入参数 名称 类型 必选 描述 stock str , 深证证券交易所: sz 输出参数 名称 类型 默认显示 描述 日期 str Y - 主力净流入-净额 str Y - 小单净流入-净额 float Y - 中单净流入-净额 float Y - 单净流入 - 超大单净流入-净额 float Y - 主力净流入-净占比 float Y 注意单位: % 小单净流入-净占比 float Y 注意单位: % 中单净流入-净占比 float Y 注意单位: % 单净流入

    55840

    AKShare-股票数据-个股资金流

    作者寄语 本次更新股票数据-个股资金流接口。本接口获取指定市场(三股票交易所)和股票的近 100 个交易日的资金流数据,本次主要新增对北京证券交易所的支持。 更新接口 "stock_individual_fund_flow" # 个股资金流 个股资金流 接口: stock_individual_fund_flow 目标地址: https://data.eastmoney.com /zjlx/detail.html 描述: 东方财富网-数据中心-个股资金流向 限量: 单次获取指定市场和股票的近 100 个交易日的资金流数据 输入参数 名称 类型 描述 stock str stock 注意单位: % 主力净流入-净额 float64 - 主力净流入-净占比 float64 注意单位: % 超大单净流入-净额 float64 - 超大单净流入-净占比 float64 注意单位: % 单净流入 -净额 float64 - 单净流入-净占比 float64 注意单位: % 中单净流入-净额 float64 - 中单净流入-净占比 float64 注意单位: % 小单净流入-净额 float64

    17520

    数据分析方法:相关分析法

    今天继续更新九数据分析方法系列。在工作中,我们经常会问: 下雨和业绩下降有多大关系? 销售上涨和新品上市有多大关系? 营销投入与业绩产出有多大关系? 而相关分析,就是找出这种关系的办法。 二、什么是“相关分析” 相关分析,特指:找到两个数据指标之间的相关关系。 比如一个APP里,用户反复浏览一款商品,所以他会买吗? 直接相关不需要数据计算,通过指标梳理就能看清楚关系。 直接相关的情况下,两个指标出现同时上涨/下跌的趋势,是很好理解的。 五、相关分析的不足之处 世界上没有完美的分析方法,相关分析有两大不足之处。 不足一:相关不等于因果。 两个指标相关关系,本质上只是一条数据公式计算出来的结果,至于两个指标为啥相关? 这就是相关不等于因果的直接体现。 不足二:相关分析不能解决非量化指标问题。 很多时候,我们想找的关系不能用数据量化。比如我们想知道:旗舰店是不是比社区店更能吸引消费者。

    27500

    2021年数据Flink(十):流处理相关概念

    ---- ​​​​​​​流处理相关概念 数据的时效性 日常工作中,我们一般会先把数据存储在表,然后对表的数据进行加工、分析。既然先存储在表中,那就会涉及到时效性概念。 如果我们处理以年,月为单位的级别的数据处理,进行统计分析,个性化推荐,那么数据的的最新日期离当前有几个甚至上月都没有问题。 但是如果我们处理的是以天为级别,或者一小时甚至更小粒度的数据处理,那么就要求数据的时效性更高了。 Analytics 流式计算,顾名思义,就是对数据流进行处理,如使用流式分析引擎如 Storm,Flink 实时处理分析数据,应用较多的场景如实时屏、实时报表。 ​​​​​​​ 因此,用户可以复用同一个作业,来处理实时数据和历史数据

    44630

    数据挖掘18算法实现以及其他相关经典DM算法

    算法使用方法在每个算法中给出了3类型,主算法程序,调用程序,输入数据,调用方法如下: 将需要数据的测试数据转化成与给定的输入格式相同,然后以Client类的测试程序调用方式进行使用。 18经典DM算法18数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够帮助大家学。 给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。 支持向量机算法是一种对线性和非线性数据进行分类的方法,非线性数据进行分类的时候可以通过核函数转为线性的情况再处理。其中的一个关键的步骤是搜索最大边缘超平面。详细介绍链接 EM 期望最大化算法。 详细介绍链接 BIRCH BIRCH算法利用构建CF聚类特征树作为算法的核心,通过树的形式,BIRCH算法扫描数据库,在内存中建立一棵初始的CF-树,可以看做数据的多层压缩。

    1.1K90

    合集 | GNN相关视频博客代码等

    下面是Sergey Ivanov@twitter总结的图网络,图机器学习相关领域 最近一段时间相关的视频,博客,代码等相关资料,小编@深度学习与图网络做了补充,希望对大家的研究有所帮助。 1. 有了它,可以从数据中发现了引力和行星质量;一种利用宇宙空隙和暗物质晕进行宇宙学的技术; 如何从接受湍流数据训练的图神经网络中提取欧拉方程。 https://www.youtube.com/watch? PyTorch Geometric(PyG)是一个构建于 PyTorch 之上的库,用来为一系列与结构化数据相关的应用编写和训练图神经网络(GNN)。 博客 3.1 PDE与GNN 用PDE(偏微分方程建模图神经网络的package)图神经网络 (GNN) 与控制图信息扩散的微分方程密切相关。 该模型可以学会不关心排序,但是如果我们还可以选择使其按设计排列不变,那将浪费训练数据和计算时间。

    21910

    Raw数据相关概念

    Raw数据相关概念 什么是“RAW”? 维基百科的字面解释是:原始图像文件包含从数码相机、扫描器或电影胶片扫描仪的图像传感器所处理数据。RAW文件包含创建一个可视图像所必须的相机传感器数据信息。 通俗讲就是摄像机、相机拍摄并记录下来的带有原始信息的视频或者图片,包含传感器元数据、传感器尺寸、颜色属性、配置文件等等信息,以方便后期对视频及图片做更大幅度的处理。 几乎未经压缩,也完全没进行各种处理,与记录拍摄时“用户的相机设置信息”数据被一同保存下来。 有损压缩表示在压缩处理过程中,部分图像数据将会被丢弃。但是抛弃这些信息后,能得到比无损压缩小得多的文件。 单反/无反相机上的 RAW 和手机上的 RAW,最大的区别在于描述明暗数据的位深不同。

    54210

    数据相关

    数据库系统概述】 常用的数据库有MySql、oracle等。不同数据库都支持sql标准,并且不同数据库在sql标准的基础上进行了一些扩充。 注意:安装oracle后会出现多个服务,可以设置为手动启动 重要的两个服务为: 1、数据库监听服务,如果要通过远程客户端(如sql develop等)连接数据库,或者直接用程序连接数据库,那么此服务必须打开 2、数据库实力服务:每个数据库都会有这种服务名称如:OracleServiceSID 【sqlplus简介】 sqlplus 首先将sql语句放到缓冲区,然后将缓冲区的sql语句提交到数据库执行 ; oracle12c 之中默认数据找不到,需要对数据进行恢复,找scott.sql文件目录下为数据 通过修改SCOTT.sql修改恢复数据 数据配置执行顺序为: 1、打开sqlplus /nolog null就表示不会有任何数据返回 any操作符 =any:功能和in相同,但是<>any不等价于not in; >any比最大值要 <any比最小值要小 范例: all操作符 空数据判断 exists

    46350

    关注

    腾讯云开发者公众号
    10元无门槛代金券
    洞察腾讯核心技术
    剖析业界实践案例
    腾讯云开发者公众号二维码

    相关产品

    • 腾讯云图数据可视化

      腾讯云图数据可视化

      腾讯云图 (TCV)是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示海量数据,10 分钟零门槛打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,无需编码,全图形化编辑,快速可视化制作……

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注腾讯云开发者

      领取腾讯云代金券