首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NRI基本概念和基于R语言计算NRI——比较两个模型预测能力

各位科研芝士朋友,大家好。最近学习到用NRI进行模型比较,起初当听到NRI这个词时候,我表情可能是这样。...作用 一般情况,预测结局事件时候,不同的人可能会建立不同预测模型,当我们去评价两个模型好坏或者预测能力强弱时候,你可能会说AUC呀,其实除了AUC,还有NRI也是用来比较两个模型预测能力。...而在诊断试验,通常根据检验指标的判断结果和金标准诊断结果,整理成一个2×2表格,如下表所示,并以此来计算诊断试验两个比较重要指标,即灵敏度和特异度。...净重新分类指数NRI 相对于ROC曲线及其AUC,NRI更关注某个设定切点处,两个模型把研究对象进行正确分类数量上变化,常用来比较两个模型预测能力准确性。...那么,便会出现原本模型中被错分,但在新模型得到了纠正,分入了正确分组,同样也有一部分研究对象,原本模型中分类正确,但在新模型却被错分情况,这个时候,我们利用这种重新分类现象,来计算净重新分类指数

12.6K20

HMM模型量化交易应用(R语言版)

函数形式:X(t+1) = f( X(t) ) HMM由来 物理信号是时变,参数也是时变,一些物理过程一段时间内是可以用线性模型来描述,将这些线性模型时间上连接,形成了Markov链。...HMM波动率市场应用 输入是:ATR(平均真实波幅)、log return 用是depmixS4包 模型输出并不让人满意。 HS300测试 去除数据比较9支,剩291支股票。...(注:横向数据没有意义!) 同时,如何避免使用某一次比较模型?! 这里老王使用是投票模式。...,然后每天入选股票中平均分配资金 (注:0票就相当于平均分配资金投票>0股票上) n=5 n=15 50个HMM模型里10-18个投票,结果都挺理想了!...同样,回撤比较问题还是不能避免。看来需要寻找其他方式来避免大回撤。

2.8K80
您找到你想要的搜索结果了吗?
是的
没有找到

R语言POT超阈值模型洪水风险频率分析应用研究

案例POT序列47年记录期内提供了高于74 m 3 / s 阈值47个峰值。 我们目标是将概率模型拟合到这些数据并估算洪水分位数。 我从获取了每次洪水日期,并将其包含在文件。...水文学,我们通常使用超出概率(洪水大于特定值概率),因此所需方程式为一个减去所示方程式。 通过将每年超过阈值洪峰平均数乘以POT概率,我们可以将POT概率转换为每年预期超标次数。...图3:河流部分序列显示契合度和置信区间 ---- 参考文献 1.R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究 2.R语言时变参数VAR随机模型 3.R语言时变参数VAR随机模型 4.R...语言基于ARMA-GARCH过程VAR拟合和预测 5.GARCH(1,1),MA以及历史模拟法VaR比较 6.R语言时变参数VAR随机模型 7.R语言实现向量自动回归VAR模型 8.R语言随机搜索变量选择...SSVS估计贝叶斯向量自回归(BVAR)模型 9.R语言VAR模型不同类型脉冲响应分析

78041

广义线性模型应用举例之泊松回归及R计算

广义线性模型应用举例之泊松回归及R计算 在前文“广义线性模型,提到广义线性模型(GLM)可概括为服务于一组来自指数分布族响应变量模型框架,正态分布、指数分布、伽马分布、卡方分布、贝塔分布、伯努利分布...前文使用一般线性模型探索可能影响R. cataractae丰度环境因素过程,最后发现acre(流域面积)、depth(水域深度)和no3(硝酸盐浓度)增加有助于R. cataractae丰度提升...忽略该回归模型精度前提下,对于各自变量回归系数意义这样解释:例如no3(硝酸盐浓度,mg/L)回归系数0.1813,代表了在当其它自变量不变情况下,硝酸盐浓度每升高1 mg/L时,R. cataractae...此时,忽略该回归模型精度前提下,对于no3(硝酸盐浓度,mg/L)回归系数指数转化值1.199,代表了在当其它自变量不变情况下,硝酸盐浓度每升高1 mg/L时,期望R. cataractae...前后两个不同模型(分别为线性回归和泊松回归)结果比较,区别是非常明显。那么,哪个结果更合理一些?

7.7K44

回归分析(3)

注:本文是回归分析专题第三部分,此专题是对即将于2021年5月出版《机器学习数学基础》补充和提升资料。 并且,只要插入公式多点,微信编辑器中就不能保存。所以,发布文章,就很少有公式了。...除了估计回归系数之外,严格统计学,还要估计 ,并进行相关假设检验,并给出置信区间。这些内容通常依据上述定理各参数分布特点解决。...对于前面训练所得到rr2两个模型,statsmodels为它们提供方法,查看有关评估结果。 r.summary() 输出: ? r2.summary() 输出: ?...时间序列分析通常很重要 Cond. No 多重共线性检验(如果与多个参数拟合,则参数彼此相关) 如此,即可实现统计线性回归模型构建。...从上面的评估结果可以看到,目前用二次曲线拟合,已经能够相当好程度上体现了两个变量之间关系——特别强调,现在我们得到是相关关系。 那么,相关关系是否就是因果关系?尚需进一步研究。 (待续)

1.4K20

【机器学习笔记】:大话线性回归(二)

我们知道,因变量y值有来自两个方面的影响: (1)来自x值影响,也就是我们预测主要依据 (2)来自无法预测干扰项ϵ影响 如果一个回归直线预测非常准确,那么它就需要让来自x影响尽可能大,而让来自无法预测干扰项影响尽可能小...▌线性回归显著性检验 要想知道我们根据样本拟合模型是否可以有效地预测或估计,我们需要对拟合模型进行显著性检验。回归分析显著性检验主要包括两方面内容:线性关系检验;回归系数检验。 1....通过上面结果我们清楚看到: F统计量p值非常小,拒绝原假设,说明线性关系显著 两个回归系数t统计量p值均为0,拒绝原假设,说明回归系数也都显著 ▌线性回归诊断 线性回归诊断包括很多内容,比较重要几个有...pp图和qq图判断标准是:如果观察点都比较均匀分布直线附近,就可以说明变量近似的服从正态分布,否则不服从正态分布。...以上就是残差分析主要内容,对于线性回归诊断还有其余线性相关性检验,多重共线性分析,强影响点分析三部分重要内容,将在下一篇进行介绍,完整代码知识星球

1.8K60

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

着重于原油市场例子。简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较 简介 希望对经济和金融领域从业人员和研究人员有用。...因此,DMA回归系数和赋予模型权重都随时间变化。 贝叶斯方法不是现代计量经济学主流。然而,这些方法最近正获得越来越多关注。这其中有各种原因。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm 所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

46920

经济学:动态模型平均(DMA)、动态模型选择(DMS)预测原油时间序列价格

着重于原油市场例子。简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较。希望对经济和金融领域从业人员和研究人员有用。...例如,对时间tDMA预测只基于截至时间t-1数据。此外,新数据获得直接导致参数更新。因此,DMA回归系数和赋予模型权重都随时间变化。 贝叶斯方法不是现代计量经济学主流。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm 所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

1.3K30

Stata 回归表格输出之 esttab 详解

: 首先,将目标回归模型估计结果进行存储; 其次,使用esttab命令将存储好估计值或统计量编辑一个回归表格; 通过下面的示例进一步掌握: ** 保存模型结果之方法一:使用 eststo 命令存储回归模型..._a 是存储模型估计结果 scalars一个标量参数 *也可以输出 p 值,置信区间(ci)或是任何存储估计结果参数统计量,它们保存在 scalars 。...同一回归模型,即便两个自变量单位一致(例如教育年限和工作经历都以年为计数单位),其回归系数也无法直接进行比较。事实上,研究涉及自变量往往具有不同测度单位,回归系数也会受到影响。...多元回归模型经常涉及各自变量对因变量相对作用大小进行比较,进而从多个因素找出首要和次要因素,这时便可以采用标准化回归系数(standardized coefficients)。...两种回归系数比较 标准化回归系数处于 -1, 1 区间内,并且可以进行标准化尺度下变量间系数比较

48.2K4131

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较 简介 希望对经济和金融领域从业人员和研究人员有用。...例如,对时间tDMA预测只基于截至时间t-1数据。此外,新数据获得直接导致参数更新。因此,DMA回归系数和赋予模型权重都随时间变化。 贝叶斯方法不是现代计量经济学主流。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm 所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

53610

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较 简介 希望对经济和金融领域从业人员和研究人员有用。...例如,对时间tDMA预测只基于截至时间t-1数据。此外,新数据获得直接导致参数更新。因此,DMA回归系数和赋予模型权重都随时间变化。 贝叶斯方法不是现代计量经济学主流。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm 所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

27200

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较 ( 点击文末“阅读原文”获取完整代码数据******** ) 。...因此,DMA回归系数和赋予模型权重都随时间变化。 贝叶斯方法不是现代计量经济学主流。然而,这些方法最近正获得越来越多关注。这其中有各种原因。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm 所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

27300

数据分析之回归分析

(P值),显著性(P值)同样与显著性水平α进行比较,本例回归系数显著性(P值)=0.000<0.01,说明回归系数b具有极其显著统计学意义,即因变量“销售量”和自变量“广告费用”之间存在极其显著线性关系...本例调整后R方为0.732,也就是说,“广告费用”,“客流量”两个自变量合起来能够解释模型变化73.2%,模型拟合效果良好。 ?...第5,6列分别是偏回归系数t检验和相应显著性(P值),限制性(P值)同样与显著性水平α进行比较,本例回归系数b1显著性(P值)=0.012<0.05,说明偏回归系数b1具有显著统计学意义,偏回归系数...2.如何选择回归模型 当只了解一两种回归技术时候,情况往往会比较简单。然而,当我们应对问题时可供选择方法越多,选择正确那一个就越难。类似的情况下也发生在回归模型。...只要所有进行比较模型因变量(本示例为学生测试分数)相同,我们就可以使用来自每个模型 AIC值确定哪一个表现更好。模型AIC值越小,越适合观测数据。

3.2K51

回归分析详解及matlab实现

可以清楚看到残差大都分布附近,因此还是比较 ,不过第4、12、19这三个样本点残差偏离原点较远,如果作为奇异点看待,去掉后重新拟合,则得回归模型为: 且回归系数置信区间更小均不包含原点,统计变量...不同自变量之间交互作用:有时,实验不仅单因素对指标有影响,而且因素间还会联合起来对指标产生影响,常称这种联合作用为交互作用。处理两个因素间交互作用一个简单办法是加入这两个自变量乘积项。...时间序列数据同一变量顺序观测值之间出现相关现象称为自相关。一旦数据存在这种自相关序列,如果仍采用普通回归模型直接处理,将产生不良后果,使预测失去意义。...某生化系学生为了研究嘌呤霉素某项酶促反应对反应速度与底物浓度之间关系影响,设计了两个实验,一个实验中所使用酶是经过嘌呤霉素处理,而另一个实验所用酶是未经嘌呤霉素处理。...Michaelis-Menten模型形式可以分别描述经过嘌呤霉素处理和未处理反应速度与底物浓度关系(两个模型参数会不同),为了同一模型中考虑嘌呤霉素处理影响,我们采用对未经嘌呤霉素处理模型附加增量方法

1.7K20

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

简要地提供了经济学中使用模型平均和贝叶斯方法论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较简介希望对经济和金融领域从业人员和研究人员有用。...例如,对时间tDMA预测只基于截至时间t-1数据。此外,新数据获得直接导致参数更新。因此,DMA回归系数和赋予模型权重都随时间变化。贝叶斯方法不是现代计量经济学主流。...如果它们每一个都由一个合适时间序列来表示,那么就可以构建2^10个可能线性回归模型。每个变量都可以包括或不包括一个模型。因此,每个变量有两种选择,构成了2^10种可能性。...R> altm所选DMA模型RMSE比两个基准预测要小,但与Auto ARIMA相当。MAE情况也类似。然而,Auto ARIMAMAE比选定DMA模型小。...另一方面,选定DMA模型在所有竞争性预测具有最高命中率。更精确比较可以通过Diebold-Mariano检验来进行。

65200

机器学习笔记——线性回归及其两种常用优化方法

一元线性方程公式应该是非常熟悉: 如果将输入数据都存放在矩阵X,而回归系数都存放在向量,这样就可以得到矩阵形式表达式: 现在问题是如何找到,我们已经知道了如何度量一个分类器性能,而回归模型性能通常使用度量方法是...矩阵中非零行个数定义为这个矩阵秩, 记为R(A),对于矩阵,若R(A)=n,则称A为满秩矩阵。 线性拟合 ?...第二个函数是绘制函数,第一个函数计算出回归系数基础上绘制回归曲线,最后绘制图像如下: ? 几乎任一数据集都可以用上述方法建立一个模型,那么这些模型好坏程度如何评断呢?...“相关系数”就可以计算预测值序列和真实值序列匹配程度,Numpycorrcoef方法就刚好可以计算出两个序列相关性。 ?...这种方法基本思想就是给待预测点附近每个点赋予一定权重,将这些权重用一个新矩阵W存储,表现形式如下: 加权模型也会认为样本点之间距离越近,越有可能符合同一个线性模型,所以对于当前预测样本点来说,

2.1K10

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间|附代码数据

包括完成导入数据文件、探索汇总统计和回归分析本文中,我们首先使用软件默认先验设置。第二步,我们将应用用户指定先验,对自己数据使用贝叶斯。准备工作本教程要求:已安装JAGS安装R软件。..._频率_主义框架,一个感兴趣参数被假定为未知,但却是固定。也就是说,假设在人口中只有一个真实的人口参数,例如,一个真实平均值或一个真实回归系数。...我们为β年龄回归系数和β年龄2系数尝试了4种不同先验规范。首先,我们使用以下先验。Age ~ N(3,0.4)Age2 ~ N(0,0.1)先验指标是模型制定步骤设置。...我们将只计算两个回归系数偏差,比较默认(无信息)模型和使用N(20,.4)和N(20,.1)先验模型。...R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较R语言实现MCMCMetropolis–Hastings算法与吉布斯采样R语言贝叶斯推断与

80500

News Co-Occurrences:关注同时出现在新闻股票

个股之间相关性随着新闻同时出现频率增加而增加。 个股新闻同时出现频率可以用于预测未来个股之间相关性,从而应用与风险模型。...其中Model1,IND、CS及GEO回归系数分别是0.073、0.098及0.032,且置信度99%区间里均显著。...这意味着处于同一个行业,存在供应链关系或在同一个地区股票有更高概率出现在同一篇新闻。...等式7,News Co-Occurrences用两个变量LNTFP和LNTFR表示,它们各自有自己回归系数,这样做就可以看出是LNTFP更重要还是LNTFR更重要。...下表3给出了以上两个模型回归结果,可以看出LNTF、LNTFP及LNTFR回归系数均显著,但可以看出LNTFR相比LNTFP来更显著,说明异常News Co-Occurrences更能引起投资者关注

76811

Python 机器学习算法实践:树回归

正文 之前文章我总结了通过使用构建决策树来进行类型预测。...《Machine Learning in Action》数据,格式比较规整加载方式也比较一致, 这里由于做树回归,自变量和因变量都放在同一个二维数组: defload_data(filename)...模型树里针对一个叶子节点我们需要使用分割到数据进行线性回归得到线性回归系数而不是简单计算数据平均值。不纯度计算也不是简单计算数据方差,而是计算线性模型残差平方和。...当x 当x>0.304时候,使用线性模型y=0.0017+1.20x来回归 回归树与线性回归对比 本部分我们使用标准线性回归和回归树分别对同一组数据进行回归,并使用同一组测试数据计算相关系数(Correlation...数据我还是使用《Machinie Learning in Action》现成数据,数据可视化如下: 现在我们分别使用标准线性回归和回归树对该数据进行回归,并计算模型预测值和测试样本相关系数R2R2

1.2K91

LASSO回归姊妹篇:R语言实现岭回归分析

岭回归中,范数项是所有系数平方和,称为L2-Norm。回归模型,我们试图最小化RSS+λ (sumβj2)。随着λ增加,回归系数β减小,趋于0,但从不等于0。...1 ## [100,] 9 8.389e-01 0.03951 以第100行为例,可以看出非零回归系数,即模型包含特征数为9。岭回归中,这个数字是常数。...数据处理 这个数据集包含在RElemStatLearn包。加载所需包和数据集。也可以找我们工作人员领取。...默认图表,Y轴是回归系数,X轴是L1范数。系数和L1范数之间关系如图43所示。图形上方还有另一个X轴,其上数字表示模型特征数。我们还可以看到系数是如何随λ变化。...实际情况,我们建议对异常值进行更深入研究,以找出它们是否真的与其他数据不同,或者我们错过了什么。与MSE基准比较可能会告诉我们一些不同东西。我们可以先计算残差,然后再计算残差平方平均值。

6K43
领券