首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

因子后花园】一个显著因子:现金循环周期(CCC)

标星★公众号 爱你们♥ 近期原创文章: ♥ 基于无监督学习期权定价异常检测(代码+数据) ♥ 5种机器学习算法在预测股价应用(代码+数据) ♥ 深入研读:利用Twitter情绪去预测股市...♥ Two Sigma用新闻来预测股价走势,带你吊打Kaggle ♥ 利用深度学习最新前沿预测股价走势 ♥ 一位数据科学PhD眼中算法交易 ♥ 基于RNN和LSTM股市预测方法 ♥ 人工智能『AI...在学术研究中,因子产生已经失去了控制。我们整理了在顶级期刊上发表400多个因子。其中许多是无效。 他们还强调,大量金融研究论文无法在他们实验环境中复制。...当一篇新因子论文在顶级期刊上发表时,我们就会一头扎进去,一探究竟。本文探讨了现金循环周期(CCC)使用,即将存货和应收账款周转时间减去支付企业应付款时间。...投资者似乎受到系统性预期错误困扰,套利成本较高股票预期回报率更高。 为什么这有关系? 现金循环周期在企业内部经常被用来评估企业管理效率和了解企业外部融资需求。

78420
您找到你想要的搜索结果了吗?
是的
没有找到

因子列表缺失数据

一、因子 所有的数据集合可以分为三类,连续型,名义型和有序型。...在R中名义型变量和有序性变量称为因子,factor。这些分类变量可能值称为一个水平level,由这些水平值构成向量就称为因子因子主要用于计算频数,可以用来分组。...可以通过factor()函数中labels选项对因子值进行批量修改。...在大规模数据采集过程中,几乎不可能每次都得到完整数据,那么该如何处理缺失数据呢?首先我们要清楚为何会出现缺失数据,一种可能是机器断电,设备故障导致某个测量值发生了丢失。...R 中会有很多类,例如在分析生物数据时,会经常遇到各种类,例如 Experiment Set 类。类是现实世界或思维世界中实体在计算机中反映,它将数据以及这些数据操作封装在一起。

41310

HashMap 底层实现、加载因子、容量值及死循环

(叶子是NULL节点) 每个红色节点两个子节点都是黑色(从每个叶子到根所有路径上不能有两个连续红色节点) 从任一节点到其每个叶子所有路径都包含相同数目的黑色节点。...如果加载因子过大,那么扩容门槛高,扩容不频繁,虽然占用空间降低了,但是这会导致元素存储密集,发生哈希冲突概率大大提高,从而导致存储元素数据结构更加复杂(用于解决哈希冲突),最终导致操作性能降低。...HashMap 底层实现、加载因子、容量值及死循环 第二步,移动节点b ? HashMap 底层实现、加载因子、容量值及死循环 注意,这里顺序是反过来,继续移动节点c ?...HashMap 底层实现、加载因子、容量值及死循环 执行后,变量e指向节点b,因为e不是null,则继续执行循环体,执行后引用关系 ?...另外,如果线程2把newTable设置成到内部table,节点c数据就丢了,看来还有数据遗失问题。

77550

因子模型之因子(信号)测试平台----因子处理(二)

所以,很多因子数值在一个行业内比较才是有效。同样思路,有些因子虽然看起来不是一些基本风格因子,比如PE,但是,其实我们知道,PE和市值有很大关系,大市值公司,一般是成熟公司,PE往往不高。...1.两种中性方法         所谓中性,最本质意义就是“无关”,我们说市场中性,就是说我们这个组合与市场无关;我们说因子做了行业中性,说明我们因子和行业没有关系,风格中性也是如此。...也就是做一个回归,其中,因子值是y,需要中性风格因子暴露为x,然后我们进行回归。回归之后残差就是因子值对行业中性化后值。这里风格因子可以是一个也可以多个,也就是一元回归和多元回归区别。...2.行业中性化         由于分风格因子通常会购买barra数据服务,所以,这里我们只进行行业中性。         首先,我们需要获得行业数据,也就是每个股票行业类别。...目前,我们暂时只进行行业中性,然后进行因子回测。

1.2K40

不同数据转录因子差异如何

这个数据库能够预测结合特定DNA位点或基序转录因子,以及可能被特定DNA结合蛋白识别的DNA基序或位点。...不仅可以查看转录因子调控基因,详细数据注释、分析结果和单个数据详细信息(数据QC情况、motif分析结果、潜在靶基因预测)、同时还可以在基因组浏览器中查看数据分布及下载分析结果文件。...TRRUST(https://www.grnpedia.org/trrust/downloadnetwork.php)不仅包含转录因子对应靶基因,也包含了转录因子调控关系。...数据库为例,为大家展示一下这三个数据集所含转录因子信息差异: ****读取不同数据库下载得到TFs列表 #1_来源于AnimalTFDB3,下载链接:http://bioinfo.life.hust.edu.cn.../ 这两个数据库关于转录因子收录,都是接近于2000个基因。

43810

Epifactors:表观因子数据

通过对研究表明参与这些表观遗传机制蛋白对应基因,功能进行整理和归纳,构建了Epifactors数据库,网址如下 http://epifactors.autosome.ru/ 为了提供更加全面和丰富认知...,在传统直接参与表观遗传蛋白基础上,定义了表观因子这个概念,将直接参与表观遗传核心蛋白和其周边蛋白联系起来,进一步丰富了表观遗传中相关分子网络结构。...对这些因子对应基因,蛋白,产物,构成蛋白复合体进行了详细注释,提供了更加完整信息链。对于表观因子功能进行了分类,几种主要功能相关因子数量统计如下 ?...可以看到gene symbol, 蛋白ID, domain, 功能,功能,构成蛋白复合体,调控目标分子等信息。 同时部分因子还提供了在不同细胞系和组织中表达量数据,示意如下 ?...该数据库中信息是免费下载,示意如下 ? 该数据库对于表观遗传领域研究人员而言,是一个非常值得参考数据库,可以快速对某个表观因子功能有一个较为完整认知。

42110

chipBase:转录因子调控网络数据

chipBase收集来自GEO,ENCODE数据库中chip_seq数据,通过对这些原始数据进行分析,致力于构建各种转录因子与非编码RNA, 蛋白编码基因之间调控网络,网址如下 http://rna.sysu.edu.cn...首先对来自10个物种一万多个样本chip_seq数据进行分析,通过peak caling得到转录因子在基因组上结合区域,同时提供了UCSC基因组浏览器可视化和motif分析。...通过peak区域与各种非编码RNA, 蛋白编码基因距离,预测对应靶基因。 最后根据来自TCGA数据库和GTEx项目约2万例样本转录组结果,对转录因子和调控基因相关性进行分析。...首先确定感兴趣转录因子,然后选择对应数据集,再选择靶基因筛选范围,最终确定转录因子潜在靶基因,结果示意如下 ? 2....Co-Expression 分析转录因子和基因表达量相关性,示意如下 ? 点击每个数据集可以查看相关性分析可视化结果,如下图所示 ?

2K40

因子模型之因子(信号)测试平台----因子处理(一)

2)Winsorized-raw factor         我们知道,金融数据充满了噪音,也就是意味着,有很多异常值,所以我们要对这些股票存货周转率值做一个处理。...而风格中性则需要和风格因子secore,或者说,exposure做回归,然后取残差作为最后neut-score。...这里,前面三步还是比较容易实现,但是第四部我们需要一个风格因子score,这就很尴尬了,因为我们并不知道有哪些风格因子。有一个神一般存在,叫做barra,读者可以自己去百度一下。...总而言之,这个数据供应商给了我们十个风格因子以及每一个因子score(exposure)。当然,我们也可以自己去建立这个。        ...这一小节,我们先尝试前面三步,后续,我们自己建立一两个风格因子来neut。 1.数据整合         为了能够实现上面这些功能,我们首先要有一个把所有数据放在一起数据集。

1.7K30

数据分析方法——因子分析

回想EM两个步骤: 循环重复直到收敛 {(E步)对于每一个i,计算(M步)计算 我们套用一下: (E步): 根据第3节条件分布讨论, 因此 那么根据多元高斯分布公式,得到...最后让其值为0,并且化简得 然后得到 到这里我们发现,这个公式有点眼熟,与之前回归中最小二乘法矩阵形式类似 这里解释一下两者相似性,我们这里x是z线性函数(包含了一定噪声)。...因子分析(factor analysis)是一种数据简化技术。它通过研究众多变量之间内部依赖关系,探求观测数据基本结构,并用少数几个假想变量来表示其基本数据结构。...24个变量共享这三个因子,但是每个变量又有自己个性,不被包含部分 ,称为特殊因子。...:对于因子分析,可以使用旋转技术,使得因子更好得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量取舍,而是根据原始变量信息进行重新组合,找出影响变量共同因子,化简数据

1.9K60

JASPAR:转录因子motif数据

JASPAR是一个免费公开转录因子数据库,在该数据库中收录了转录因子mitif信息,可以用来预测转录因子与序列结合区域。...JASPAR CORE 该类别下都是从文献中收集,有实验证据支持真核生物转录因子motif信息,而且经过了人工核对,是一个非冗余,高质量转录因子motif数据库,所以也是整个数据库中核心。...Collection CNE 该数据包含了233个调控人类非编码基因转录因子motif信息,是根据Xie et al. (PNAS 2007)文章中数据收集整理,编号以CN开头,示意如下 ?...Collection PBM HOMEO 该类别下包含是小鼠转录因子motif信息,是从文献Berger et al (Cell 2008)整理得到,每个motif编号以PH开头,示意如下 ?...Collection SPLICE 该类别包含是human剪切位点motif序列,数据量很小,一共只有6个motif, 每个motif编号以SA开头,示意如下 ?

1.8K21

dbCoRC:核心转录因子数据

超级增强子SE区域内包含许多转录因子结合位点,有科学家发明了CRC Mapper这种算法,通过超级增强子关联转录因子来识别细胞或组织中CRC。...dbCoRC是一个核心启动因子数据库,通过超级增强子关联转录因子来鉴定不同组织或者细胞中CRC。...以H3K27ac作为增强子mark, 从GEO数据库中下载chip_seq原始数据,首先通过MACS软件识别增强子区,然后通过ROSE软件识别超级增强子。...点击转录因子ID, 可以查看该转因子在其他转录因子SE区域结合位点,示意如下 ? 同时还提供了该转录因子在TCGA等不同数据库中表达量信息,示意如下 ?...dbCoRC侧重于分析超级增强子区域关联转录因子调控关系,如果只是单纯分析超级增强子,更加推荐SEdb数据库。

91410

数据分析之因子分析

由于归结出因子个数少于原始变量个数,但是它们又包含原始变量信息,所以,这一分析过程也称为降维。...因子分析主要目的有以下三个: (1)探索结构:在变量之间存在高度相关性时候我们希望用较少因子来概括其信息; (2)简化数据:把原始变量转化为因子得分后,使用因子得分进行其他分析,比如聚类分析、回归分析等...(2)变量共同度 变量共同度就是每个变量所包含信息能够被因子所解释程度,其取值范围介于0和1之间,取值越大,说明该变量能被因子解释程度越高。...(4)因子得分 因子得分可以用来评价每个个案在每个因子分值,该分值包含了原始变量信息,可以用于代替原始变量进行其他统计分析,比如回归分析,可以考虑将因子得分作为自变量,与对应因变量进行回归。...检验统计量在0.5以下,不适合因子分析,在0.7以上时,数据较适合因子分析,在0.8以上时,说明数据极其适合因子分析。

2.1K40

因子投资:影响全球商品价格共同因子

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域主流自媒体。...本文对商品价格变动进行建模,将每个商品价格序列分解为: 所有商品价格变动共同影响因子:全球因子 板块因子 特质因子 区分全球、特定市场和特质等因子有助于将不太普遍因子与纯粹共同因素区分开来,并基于以下假设...值得注意是,全球因子虽然能够解释商品价格联动,而且对商品价格本身影响有限,相对价格大幅波动主要是由商品自身因素(特质因子)造成。...数据 本文使用IMF商品价格数据库,包括64个品种1980年1月至2020年3月月度价格数据。下表展示了本次研究使用品种统计,其中Share一栏表示该品种占世界贸易占比。...然而,在实际应用中经常出现情况是,简单平均有一个很大噪声成分,这是由特质因子引起。 通过直接对比全球因子与相关宏观经济指标,我们可以更清楚看出全球因子与经济活动关系。

67330

footprintDB:综合性转录因子数据

表示转录因子名称,对应基因,家族,序列等基本信息,DNA motifs代表该转录因子结合区域保守模式,DNA binding sites代表该转录因子实际结合区域,target genes代表转录因子调控靶基因...footprintDB是一个综合性转录因子数据库,通过整合多个转录因子相关数据库,最终构建出一个非冗余数据集,在该数据库中,存储了transcription factors, DNA motifs...包含了转录因子对应基因,物种,蛋白编号,蛋白序列, 序列, motif, binding sites 等信息。 2. DNA Binding Motif ?...包含了motif编号,对应物种,一致性序列,sequence logo, PSSM矩阵,binding sites 等信息。 3. DNA binding Sites ?...包含了结合位点编号,序列,对应motif和转录因子等信息。

90010

因子合成思考

最近思考了一些关于因子合成东西。多因子体系里,我们希望通过多个因子叠加来提高模型整体对于未来收益率预测能力。如何确定叠加后因子一定会效果更好?...因子相关性 一般来说,我们考虑更多因子共线性,也就是因子相关性,之前写过一篇文章(点这里),分析了因子共线性对于因子合成结果影响以及通过正交化方式消除相关性。...因子分布 除了因子相关性,还有一个很重要问题是因子分布特征,两个分布不同因子合成之后,因子效果是否会变好?从IC角度来说,前面的推导可以看出,因子分布是不影响IC,但分布会影响因子效果。...比如一个因子是正态,另一个因子是均匀分布,均匀分布峰度会异常低,数据集中度低,头尾部概率会高很多,结果是合成因子得分头尾部会严重依赖于均匀分布因子值,正态分布因子效果会被严重削弱,中间部分会严重依赖于正态分布值...反之如果是一个t分布因子和正态分布因子,t分布因子峰度会异常高,使得因子集中度非常高,两端概率很小,结果是头尾部会严重依赖于正态分布因子值,而中间部分严重依赖于t分布因子值。

2K21

混合线性模型中固定因子和随机因子检验

问题: 如何使用asreml进行固定因子wald检验和随机因子LRT检验?...下面是使用lme4解决方案: 很多朋友写信问我, 像要知道固定因子显著性和随机因子显著性如何计算,他们使用是lme4这个R包, 但是这个包使用anova时没有P值,还要手动计算, 随机因子也需要自己计算...载入数据和软件包 ###载入软件包和数据 library(lme4) library(lmerTest) library(sjstats) library(learnasreml) data(fm) 2...,它有两个函数: lmerTest::anova.lmerModLmerTest用于检测固定因子显著性, 方差分析表采用III平方和形式. lmerTest::ranova用于检测随机因子显著性,...完整代码分享 # 混合线性模型, 如何检测固定因子和随机因子 ###载入数据 library(lme4) library(lmerTest) library(sjstats) library(learnasreml

1.7K20

多目标多因子算法和多因子算法区别

多目标多因子算法和多因子算法区别 “参考文献 [1]GUPTA A, ONG Y-S, FENG L, et.al....Gupta等[1]于2017年首次将多任务优化运用到解决多目标问题中,并在MFEA基础上进行了拓展提出了一种多目标多因子进化算法(MOMFEA)。...MOMFEA继承了MFEA中技能因子和标量适应度,扩展了因子排名概念。 在多目标问题中,帕累托最优解之间是非支配关系,不能单一根据一个目标函数值好坏判断一个解好坏。...因此,因子排名不是根据因子成本而是根据非支配排序和拥挤距离进行排序。 MOMFEA中解编码与解码,选择性交配和垂直文化传播机制与MFEA中相同。...因子排名更新 在MFEA中,因子排名根据因子成本进行计算。在MOMFEA中,由于有多个目标函数,不能单由因子成本来决定因子排名,进而通过非支配排序和拥挤距离对个体进行排序。

1.2K10
领券