首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Excel公式技巧94:不同工作表查找数据

很多时候,我们都需要从工作簿各工作表中提取数据信息。如果你在给工作表命名时遵循一定规则,那么可以将VLOOKUP函数与INDIRECT函数结合使用,以从不同工作表中提取数据。...假如有一张包含各种客户销售数据表,并且每个月都会收到一张新工作表。这里,给工作表选择命名规则时要保持一致。...汇总表上,我们希望从每个月份工作表查找给客户XYZ销售额。假设你单元格区域B3:D3输入有日期,包括2020年1月、2020年2月、2020年3月,单元格A4输入有客户名称。...每个月销售表结构是列A是客户名称,列B是销售额。...当你有多个统一结构数据源工作表,并需要从中提取数据时,本文介绍技巧尤其有用。 注:本文整理自vlookupweek.wordpress.com,供有兴趣朋友参考。 undefined

12.9K10

ANFD-HLA不同人群频率数据

研究SNP时,我们有类似1000G,HapMap, Exac 等数据库,提供了不同人群频率信息。对于HLA研究而言,也有存储频率信息数据库-ANFD。...,其中记录了allel, haplotype, genotype 3种格式信息,最关键是,提供了不同人群频率信息。...Allel 不同人群频率 通过该数据检索功能,可以查询HLA Allel不同人群频率分布,网址如下 http://www.allelefrequencies.net/hla6006a.asp...2. haplotype 不同人群频率 由于HLA基因簇紧密连锁性,除了单个Allel频率外,相关单倍型频率也是需要关注。...上述条件检索结果如下 ? 通过ANFD数据库,我们可以方便得到HLAAllel和haplotype人群频率信息,除此之外,官网还提供了许多其他功能,有待进一步学习和使用。

1.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

追涨行为因子:基于上交所投资者账户数据散户交易行为量化策略

关于 ,可以用两种计算方式:1. 简单算术平均;2. 使用股票买入时持仓权重。本文接下来分析,主要采用了算术平均加权方式,且选取 。...前5列使用月度所有面板数据计算均值方差;第6和7列计算逻辑是:先计算每个账户在有效期内RCP均值,再计算每个截面所有账户RCP均值及标准差;第8和9列计算逻辑是:先计算每个截面所有账户RCP均值...比较第2、7及9列,可以看出,面板数据波动(标准差)主要来自第7列截面数据波动,也就是说同一时间不同账户RCP差异要大于同一账户不同时间RCP差异。...面板汇总统计数据,我们计算RCP平均值为32%,标准差为81%。告诉我们,一般投资者购买股票过去一年回报率比市场回报率高32%,这表明他们追逐平均回报率相当高。...经验是投资者投资年龄,平均6.4岁。最后,Female是一个表示投资者性别的虚拟变量。 表3,列(1)报告了当RCP与其他投资者特征之间回归系数。

1.2K21

Java时间戳计算过程遇到数据溢出问题

背景 今天跑定时任务过程,发现有一个任务设置数据查询时间范围异常,出现了开始时间戳比结束时间戳大奇怪现象,计算时间戳代码大致如下。...int类型,计算过程30 * 24 * 60 * 60 * 1000计算结果大于Integer.MAX_VALUE,所以出现了数据溢出,从而导致了计算结果不准确问题。...,因为30 * 86400000 = 2592000000,但是计算出来却是:-1702967296。...到这里想必大家都知道原因了,这是因为java整数默认类型是整型int,而int最大值是2147483647, 代码java是先计算右值,再赋值给long变量。...计算右值过程(int型相乘)发生溢出,然后将溢出后截断值赋给变量,导致了结果不准确。 将代码做一下小小改动,再看一下。

94110

R语言马科维茨Markowitz均值-方差(风险投资模型)分析最优投资组合数据预期收益率可视化|附代码数据

col = sample(2:ncol(X0), 5)从X0数据集中随机选择5个列,将其索引存储变量col。这些列将用于构建投资组合。...该模型核心思想是通过最大化预期回报与最小化投资风险之间权衡,构建出在给定风险水平下收益最高投资组合。具体而言,该模型通过计算不同资产组合权重,以及资产之间相关性,进而确定最优投资组合。...通过将不同资产投资组合权重调整,可以实现在给定风险范围内最大化投资回报。...对第二个类数据集进行分析:读取名为"sample2.csv"CSV文件,并将其存储变量X0。然后,计算X0数据行数,并加载了两个R包:fPortfolio和tseries。...col = sample(2:ncol(X0), 5)从X0数据集中随机选择5个列,将这些列索引存储变量col。这些列将用于构建时间序列对象X。

27500

数据科学学习手札58)R处理有缺失值数据高级方法

一、简介   实际工作,遇到数据带有缺失值是非常常见现象,简单粗暴做法如直接删除包含缺失值记录、删除缺失值比例过大变量、用0填充缺失值等,但这些做法会很大程度上影响原始数据分布或者浪费来之不易数据信息...,因此怎样妥当地处理缺失值是一个持续活跃领域,贡献出众多巧妙方法,不浪费信息和不破坏原始数据分布上试图寻得一个平衡点,R中用于处理缺失值包有很多,本文将对最为广泛被使用mice和VIM包中常用功能进行介绍...matshow,VIM包matrixplot将数据框或矩阵数据缺失及数值分布以色彩形式展现出来,下面是利用matrixplot对R自带airquality数据集进行可视化效果: rm...3、自编函数计算各个变量缺失比例   为了计算出每一列变量具体缺失值比例,可以自编一个简单函数来实现该功能: > #查看数据集中每一列缺失比例 > miss.prop <- function(x)...,具体用法下文示例中会详细说明 maxit: 整数,用于控制每个数据框迭代插补迭代次数,默认为5 seed: 随机数种子,控制随机数水平     在对缺失值插补过程,非常重要是为不同变量选择对应方法

3K40

每周学点大数据 | No.15 图计算存储

No.15计算存储 Mr. 王:还有一个很重要问题,就是图计算表示。...虽然我们看到图边和点等都是非常直观,可以画成一个圆圈里带一个数字表示顶点,用一条带有数字线段或者箭头来表示边,但是计算,显然不能用这种方式来存储它。...王:是啊,图已经是对现实世界一个抽象了,计算我们要对其进行进一步抽象。你想一想,图由哪两部分组成? 小可:边集合和顶点集合。 Mr....如果这些节点还有权值,那么就记在另一张表。实际存储计算时,我们会用一个二维数组来表示,其中A,B,C,D,E这些字母用数组下标0,1,2,3,4来表示。 小可:那么如何来表示一条边呢?...我们讨论课,我会给出这些经典算法数据版本。当然,在那之前,我会带你复习其经典版本。 内容来源:灯塔大数据

1.2K70

关于create database语句10g,11g不同(r5笔记第88天)

首先我11g创建了一个数据库实例,使用create database来完成,创建语句类似下面的形式。...11g实例很快就创建完成了。然后就想直接引用这个现成脚本,简单修改一下路径,数据库实例名,10g环境创建一个数据库实例。 但是却报出了下面的错误。...11g是默认有2个 第二个不同之处是10g中有一个配置MAXINSTANCES,11g缺没有,因为是单实例数据库,是找不出理由是这个地方不同引起问题。...blocksize不同了,10g没有blocksize字样。...这个值是在数据源代码中固定,与操作系统相关,默认值为512. 不同os可能会有所不同。 查看blocksize配置,可以使用基表。

69540

一天一大 leet(最佳买卖股票时机含冷冻)难度:中等-Day20200710

满足以下约束条件下,你可以尽可能地完成更多交易(多次买卖一支股票): 你不能同时参与多笔交易(你必须在再次购买前出售掉之前股票)。 卖出股票后,你无法第二天买入股票 (即冷冻为 1 天)。...第一天收益设置为 -prices[0],作为成本(即成本也纳入收益计算) 第 i 天价格为 prices[i] 冷冻 如果这一天为冷冻说明为前一天卖出,则这一天收益为: 前一天持有最大收益+卖出盈利...dp[i-1][持有] + prices[i] 不持有 如果这一天不持有则前一天可能是不持有或者为冷冻(一定不是持有),则这一天收益理论上不变沿用前一天收益计算收益最大则取两周可能较大收益...max(前一天持有最大收益, 前一天不持有最大收益-今日成本) max(dp[i-1][持有], dp[i-1][不持有]-prices[i]) 示例:[1,2,3,0,2] ?...i 不同状态收益只需要 i-1 不同状态收益 那可以声明一个中间变量来存贮 i-1 状态就可以替代 dp 作用了 /** * @param {number[]} prices * @return

22510

R语言BRFSS数据可视化分析探索糖尿病影响因素

该研究是追溯性,而不是设计性实验,因此尽管可以推断出相关性,但不能因果关系。 数据集中特征既是连续又是分类。...由于数据对数规范版本几乎是正常单峰数据,因此可以将权重用于推断统计后续分析。 女性参加者比男性参加者更多,其幅度大大超过美国总人口。这可能表明抽样方法性别抽样方面并非完全随机。...但是,数据样本足够大,可以继续评估健康风险因素。 年龄范围似乎两端都偏向极端。 比较年龄和体重时,性别的体重分布似乎确实存在明显差异。男性似乎比女性重。...(变量:性别,X_ageg5yr,weight2,diabete3) 当观察样本女性和男性参与者时,报告糖尿病比率非常相似。...第4部分:结论 从数据初步探索可以明显看出,某些功能具有比其他功能更强相关性。体重与性别有关。性别似乎与体重无关。但是,糖尿病似乎与年龄有关,而与体重密切相关。

90711

动量因子30年

首先,每个月,计算过去一段时期,即回顾(通常在3到12个月之间)累计股票收益率。其次,利用这些收益将股票分成十分位数投资组合,并计算持有期间等权重投资组合回报。...面板回归中,β对过去收益是正,且具有统计学意义,t统计量超过5。在过去收益为正(负)时做多(做空)交易策略,58种资产中有52种产生统计上为正平均收益。...尽管投资者面对新证据时,会向正确方向更新他们后验,但他们更新程度与理性贝叶斯基准更新程度不同。随后对股票内在价值价格调整产生正自协方差,从而在股票回报形成动量。...然而,研究表明,1个月回顾和1个月持有期是最有利可图行业动量。 Hoberg和Phillips(2018)依赖于基于文本网络行业分类(TNIC),而不是固定行业分类。...改进包括从因子敞口中分离特定公司回报,用事前波动率来调整头寸,或延迟形成计算过去回报。然而,动量起源仍然存在争议。

1.2K30

来!因子投资基金如何赚钱?

除此之外,为了后续检验结果在统计上有效,数据还需要排除【存续时间少于36个月】基金、【资产规模5千万美元以下】和【CAPM R^2值低于0.6】基金,因为R^2值如果太低,则用CAPM模型不能有效解释收益来源...TNA_i,t:基金it时刻基金总净值(total net asset) M_i,t:由于并购而导致总净值增长 r_t:基金t 时刻的当月收益率 当基金资金流入为正时,资金流动分布以负值展示。...而资金权重收益率通过IRR 方式来计算,将初始总净值定义负值作为初始值,定义最新总净值为终值: ? ? 不同风格因子基金投资者真实年化收益 ?...但需要注意是,上表"Buy and hold"并不是单纯地买入持有就不管了,而是每个月要将投资组合再平衡到目标权重,这种操作有机会会使投资组合获得额外再平衡收益。...关于共同基金是否能够获取超额收益,学术界上有不同见解。

80820

R语言金融市场量化交易:布林带、价差策略、RSI交易策略,回测COMP 226

测试该策略从现在开始,我们将重复使用实用工具脚本 "utilities.R "函数。在这种情况下,我们将使用。- getLogReturns(prices),从调整后价格中计算出对数回报。...- getEquityLog(log_ret,pos),从对数收益和仓位向量中计算出股权曲线。...BBands函数TTR quantmodchartSeries结合了xts和TTR功能策略代码我们将使用与相同循环、收益和权益曲线计算改变是位置向量计算pos <- long + short...当且仅当持有期过后,我们退出交易  通过计数小于持有期时留在交易来实现。...  - 数据漂移可能导致良好参数组合在样本内和样本外期间有所不同  最受欢迎见解1.R语言对S&P500股票指数进行ARIMA + GARCH交易策略2.R语言改进股票配对交易策略分析SPY—TLT

85320

27%年化回报率深度趋势跟踪策略

我们还使用了早停机制来防止模型过拟合,并进行了数据预处理和输入数据调整,以提高模型性能。 3.4 训练数据 训练长度设置为20年,交易为5年,这导致两个连续训练共计25年。...在这20年训练数据,我们将最后4年用作验证集,以计算在保留样本上验证准确率。为了进行训练,我们选择那些至少有20年历史记录股票。...由于这些规则存在,我们第一个训练期中可以选择股票数量为306只,第二个训练期中为334只。 由于缩小了股票选择范围,相对于持有整个指数替代方案,我们数据集可能会有一些偏差。...实际上,随机抽样分布平均每日收益低于市场收益,这意味着通过从我们样本集中随机选择股票,平均而言无法超过基准指数表现。...上图提供了不同再平衡频率(每日、每周、每月)和选定股票数量(1、2、3)累积收益概述,不计算交易成本。

58152

R语言马科维茨Markowitz均值-方差(风险投资模型)分析最优投资组合数据预期收益率可视化

col = sample(2:ncol(X0), 5) 从X0数据集中随机选择5个列,将其索引存储变量col。这些列将用于构建投资组合。...该模型核心思想是通过最大化预期回报与最小化投资风险之间权衡,构建出在给定风险水平下收益最高投资组合。 具体而言,该模型通过计算不同资产组合权重,以及资产之间相关性,进而确定最优投资组合。...通过将不同资产投资组合权重调整,可以实现在给定风险范围内最大化投资回报。...对第二个类数据集进行分析: 读取名为"sample2.csv"CSV文件,并将其存储变量X0。然后,计算X0数据行数,并加载了两个R包:fPortfolio和tseries。...col = sample(2:ncol(X0), 5) 从X0数据集中随机选择5个列,将这些列索引存储变量col。这些列将用于构建时间序列对象X。

35700

R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析

【2】随着计算机技术不断突破,分位数回归软件包现已是主流统计软件R、SAS等座上客了,分位数回归也就自然而然地成为经济、医学、教育等领域常用分析工具。...查看数据 读取数据 head(data) σ收敛检验 从变异系数变化趋势来看,06年以后,波动趋势变小,因此参数逐渐收敛。...基于面板数据分位数回归分析——浙江省GDP影响因素[J]. 财经纵览_财政金融 (2015年10). [3]李育安. 分位数回归及应用简介[J]....用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析 R使用LASSO回归预测股票收益 金融时间序列模型ARIMA 和GARCH 股票市场预测应用 时间序列分析模型...SV)模型对股票价格时间序列建模 R语言回测交易:根据历史信号/交易创建股票收益曲线 PythonTensorFlow长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化 R语言

20830

新颖研究 | 长期投资与三角形可视化邂逅(附代码)

然后聚合返回,并为每个可能子窗口计算年化收益。 为了便于说明,我们将研究来自Kenneth R....French数据分析,我们将研究因子收益(价值,规模和动量),并假设我们假想投资者可以获得多头头寸但不能卖空。因此,我们计算因子返回代理为: ? ?...在下面的代码,我们将动量因子加入到三个经典Fama-French因子,并计算本文中使用四个不同因子收益序列(市值,价值,规模和动量)。 ?...本文中所有公式,尤其是索引,都将参考上三角图。 如果人们对整个投资更精细粒度感兴趣,则可以调整重采样规则。例如,图4我们考虑了2009年至2019年之间季度投资。...收益三角形可用于显示不同持有期间和不同开始和结束日期策略或资产性能。此外,收益三角形还可用于执行不同策略或资产成对比较。为了研究不同投资视野风险度量,我们引入了最大下降和波动三角形。

75230

股票预测模型复杂性利弊

下表1给出了不同模型基于不同处理方法结果,其中括号外数值表示基于预测值做多指数(预测为负时持有现金)策略夏普比率,括号里百分比为预测准确度。...会计数据可以被修改,而且它们可能会出现重大报告延迟。因此,我们从信息集中剔除了收益变量、账面市值比变量和通货膨胀数据。...下表3给出了测试结果,最后一行Average是四个模型复合模型测试结果。数据集中,Lag从1到4增加,模型效果越来越好,说明大部分数据并不能在数据标注日期真正获得。...模型解释变量稳定性 使用滚动窗口,不同时期同一个变量解释性也不断变化。 本次回测所选变量换手率为37%。26%月份,股息收益率是被选择变量。...19%月份,国债收益率是被选择变量。17%月份,一年股票风险溢价是被选择变量。仅使用二次判别分析对股息收益率进行预测,使用一天滞后,准确率为58.0%,年化夏普比率为0.827。

23730

计算和图数据实际应用限制和挑战,以及处理策略

图片图计算和图数据实际应用存在以下限制和挑战:1. 处理大规模图数据挑战: 大规模图数据处理需要高性能计算和存储系统,并且很多图算法和图查询是计算密集型。...因此,图计算和图数据库需要具备高度可扩展性和并行处理能力,以应对大规模图数据挑战。2. 数据一致性和完整性问题: 图数据数据通常是动态变化,对于并发写入操作,需要确保数据一致性和完整性。...这需要在图数据库设计和实现引入一致性协议和事务机制,以保证数据正确性。3. 复杂查询和算法支持: 图数据库需要支持复杂图查询和算法,例如最短路径、社区发现等。...数据可视化和可理解性: 图数据数据通常是以网络图形式表示,对于用户来说,直接理解和分析图数据可能会存在困难。...分布式处理和存储: 设计和实现具有高可扩展性和并行处理能力计算和图数据库系统,利用分布式计算和存储技术,以支持大规模图数据处理和查询。2.

26631
领券