首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用图机器学习探索 A 股个股相关性变化

在本文中我们将介绍如何使用 Java 语言的图分析库 JGraphT 5 并借助绘图库 mxgraph 6 ,可视化探索 A 股的行业个股相关性随时间的变化情况。...边的权重代表边的源点和目标点所代表的两支股票所属上市公司业务上的的相似度——相似度的具体计算方法参考 7,8:取一段时间(2014 年 1 月 1 日 - 2020 年 1 月 1 日)内,个股的日收益率的时间序列相关性...这意味着距离越远的个股,两个之间的收益率相关性越低。...——这意味着随着时间变化,这个版块内各种一直保持比较高的相关性;但有些板块(制造)的聚集性会持续变化——意味着相关性一直在发生变化。...受限于停牌、熔断、涨跌停、送转、并购、主营业务变更等情况,数据处理可能有错误,未做一一检查。 受时间所限,本文只选用了 160 个个股样本过去 6 年的数据,只采用了最小扩张树一种办法来做聚类分类。

1.4K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AkShare-股票数据-个股新闻

    作者寄语 获取个股最新的 20 条新闻文字稿内容 更新接口 "stock_news_em" # 个股新闻 个股新闻 接口: stock_news_em 目标地址: http://so.eastmoney.com.../news/s 描述: 获取东方财富指定个股的新闻资讯数据 限量: 当日最近 20 条新闻资讯数据 输入参数 名称 类型 必选 描述 stock str Y stock="300059"; 股票代码...接口示例 import akshare as ak stock_news_em_df = ak.stock_news_em(stock="601318") print(stock_news_em_df) 数据示例...【经营数据】 中国平安:2020年净利1431亿元同比降4.2% e公司讯,中国平安6013182月3日晚间披露年报,公司2020年实现净利润1431亿元,同比下降4.2%。...相关报道,2021-02-03 16:33:11,http://finance.eastmoney.com/a/202102031801241590.html 601318,19股受融资客青睐 净买入超亿元

    68510

    2015年数据相关职业盘点

    2015年马上就要过去了,在这一年里,“大数据相关职业在全球就业市场的情况到底如何?我们通过WANTED Analytics和福布斯杂志刚刚公布的2015年数据为大家进行一些总结。...在对过去12个月美国就业市场“大数据相关岗位的分析中发现: 就岗位数量而言,需要“大数据”技能的岗位空缺呈现高速增长,如下图所示,其中“大数据”解决方案的销售人员、计算机系统分析师、管理分析师、IT项目经理...首先具有相关背景的本科毕业生或职业人士通过短而实用的数据分析课程,能够迅速满足相关企业的岗位空缺,因而非常抢手。...所以如果你对计算机科学感兴趣,又想在毕业后从事大数据相关岗位,你可以在本科阶段侧重于对人工智能、机器学习和数据理论的学习。...与此同时,越来越多的商学院开始开设专攻商业数据分析的本科和研究生项目,尽管不像计算机科学专业对于理工科知识有那么高的要求,但是还会 涉及一定的数据库设计、分析和编程,以及相关统计软件如Hadoop和SAS

    27020

    AkShare-股票数据-个股资金流

    作者寄语 更新个股资金流数据接口,目前该接口的历史数据只有近 100 个交易日的数据,有需要的小伙伴可以每日自行存储。...更新接口 "stock_individual_fund_flow" # 个股资金流 个股资金流 接口: stock_individual_fund_flow 目标地址: http://data.eastmoney.com.../zjlx/detail.html 描述: 获取东方财富网-数据中心-个股资金流向 限量: 单次获取指定市场和股票的近 100 个交易日的资金流数据 输入参数 名称 类型 必选 描述 stock str..., 深证证券交易所: sz 输出参数 名称 类型 默认显示 描述 日期 str Y - 主力净流入-净额 str Y - 小单净流入-净额 float Y - 中单净流入-净额 float Y - 单净流入...- 超大单净流入-净额 float Y - 主力净流入-净占比 float Y 注意单位: % 小单净流入-净占比 float Y 注意单位: % 中单净流入-净占比 float Y 注意单位: % 单净流入

    77640

    AKShare-股票数据-个股资金流

    作者寄语 本次更新股票数据-个股资金流接口。本接口获取指定市场(三股票交易所)和股票的近 100 个交易日的资金流数据,本次主要新增对北京证券交易所的支持。...更新接口 "stock_individual_fund_flow" # 个股资金流 个股资金流 接口: stock_individual_fund_flow 目标地址: https://data.eastmoney.com.../zjlx/detail.html 描述: 东方财富网-数据中心-个股资金流向 限量: 单次获取指定市场和股票的近 100 个交易日的资金流数据 输入参数 名称 类型 描述 stock str stock...注意单位: % 主力净流入-净额 float64 - 主力净流入-净占比 float64 注意单位: % 超大单净流入-净额 float64 - 超大单净流入-净占比 float64 注意单位: % 单净流入...-净额 float64 - 单净流入-净占比 float64 注意单位: % 中单净流入-净额 float64 - 中单净流入-净占比 float64 注意单位: % 小单净流入-净额 float64

    70420

    数据分析方法:相关分析法

    今天继续更新九数据分析方法系列。在工作中,我们经常会问: 下雨和业绩下降有多大关系? 销售上涨和新品上市有多大关系? 营销投入与业绩产出有多大关系?...而相关分析,就是找出这种关系的办法。 二、什么是“相关分析” 相关分析,特指:找到两个数据指标之间的相关关系。 比如一个APP里,用户反复浏览一款商品,所以他会买吗?...直接相关不需要数据计算,通过指标梳理就能看清楚关系。 直接相关的情况下,两个指标出现同时上涨/下跌的趋势,是很好理解的。...五、相关分析的不足之处 世界上没有完美的分析方法,相关分析有两大不足之处。 不足一:相关不等于因果。 两个指标相关关系,本质上只是一条数据公式计算出来的结果,至于两个指标为啥相关?...这就是相关不等于因果的直接体现。 不足二:相关分析不能解决非量化指标问题。 很多时候,我们想找的关系不能用数据量化。比如我们想知道:旗舰店是不是比社区店更能吸引消费者。

    75400

    2021年数据Flink(十):流处理相关概念

    ​​​流处理相关概念 数据的时效性 日常工作中,我们一般会先把数据存储在表,然后对表的数据进行加工、分析。既然先存储在表中,那就会涉及到时效性概念。...如果我们处理以年,月为单位的级别的数据处理,进行统计分析,个性化推荐,那么数据的的最新日期离当前有几个甚至上月都没有问题。...但是如果我们处理的是以天为级别,或者一小时甚至更小粒度的数据处理,那么就要求数据的时效性更高了。...Analytics 流式计算,顾名思义,就是对数据流进行处理,如使用流式分析引擎如 Storm,Flink 实时处理分析数据,应用较多的场景如实时屏、实时报表。 ​​​​​​​...因此,用户可以复用同一个作业,来处理实时数据和历史数据

    1.2K30

    模型相关技术-初识RAG

    简单来讲就是让用户的问题先经过一个提前预置的专业知识库,先检索知识库,将知识库的响应提交给模型,让模型总结输出,或者直接就输出了,不经过大模型总结。...为什么需要RAG 模型在没有答案的情况下提供幻象数据,也就是胡说八道。 当用户需要特定的当前响应时,提供过时或通用的信息,模型提供的最新信息为训练模型时的数据。...图片 向量(vector)是在语言模型、知识库交互、计算过程中的重要指标。它可以将文本和知识表示为数学向量,实现文本相似度计算、知识库检索和推理等功能。...阶段二:RerankModel擅长优化语义搜索结果和语义相关顺序精排。...参考: 什么是向量数据库_向量数据库简介_向量数据库的优势以及应用场景-腾讯云开发者社区 (tencent.com) AIGC|人人都在说的向量数据库究竟是什么?小白也能读懂!

    30741

    数据挖掘18算法实现以及其他相关经典DM算法

    算法使用方法在每个算法中给出了3类型,主算法程序,调用程序,输入数据,调用方法如下: 将需要数据的测试数据转化成与给定的输入格式相同,然后以Client类的测试程序调用方式进行使用。...18经典DM算法18数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够帮助大家学。...给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。...支持向量机算法是一种对线性和非线性数据进行分类的方法,非线性数据进行分类的时候可以通过核函数转为线性的情况再处理。其中的一个关键的步骤是搜索最大边缘超平面。详细介绍链接 EM 期望最大化算法。...详细介绍链接 BIRCH BIRCH算法利用构建CF聚类特征树作为算法的核心,通过树的形式,BIRCH算法扫描数据库,在内存中建立一棵初始的CF-树,可以看做数据的多层压缩。

    1.4K90

    Raw数据相关概念

    Raw数据相关概念 什么是“RAW”? 维基百科的字面解释是:原始图像文件包含从数码相机、扫描器或电影胶片扫描仪的图像传感器所处理数据。RAW文件包含创建一个可视图像所必须的相机传感器数据信息。...通俗讲就是摄像机、相机拍摄并记录下来的带有原始信息的视频或者图片,包含传感器元数据、传感器尺寸、颜色属性、配置文件等等信息,以方便后期对视频及图片做更大幅度的处理。...几乎未经压缩,也完全没进行各种处理,与记录拍摄时“用户的相机设置信息”数据被一同保存下来。...有损压缩表示在压缩处理过程中,部分图像数据将会被丢弃。但是抛弃这些信息后,能得到比无损压缩小得多的文件。...单反/无反相机上的 RAW 和手机上的 RAW,最大的区别在于描述明暗数据的位深不同。

    1.4K10

    数据相关

    数据库系统概述】 常用的数据库有MySql、oracle等。不同数据库都支持sql标准,并且不同数据库在sql标准的基础上进行了一些扩充。...注意:安装oracle后会出现多个服务,可以设置为手动启动 重要的两个服务为: 1、数据库监听服务,如果要通过远程客户端(如sql develop等)连接数据库,或者直接用程序连接数据库,那么此服务必须打开...2、数据库实力服务:每个数据库都会有这种服务名称如:OracleServiceSID 【sqlplus简介】 sqlplus 首先将sql语句放到缓冲区,然后将缓冲区的sql语句提交到数据库执行...; oracle12c 之中默认数据找不到,需要对数据进行恢复,找scott.sql文件目录下为数据 通过修改SCOTT.sql修改恢复数据 数据配置执行顺序为: 1、打开sqlplus /nolog...null就表示不会有任何数据返回 any操作符 =any:功能和in相同,但是any不等价于not in; >any比最大值要 <any比最小值要小 范例: all操作符 空数据判断 exists

    1.8K50
    领券