首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言小数定律的保险业应用:分布模拟索赔次数

SiméonPoisson对数学近似值不感兴趣:他的主要观点是针对他正在处理的数据获得具有良好拟合优度的分布。...他确实获得了以下分布(此处,分布的参数为0.61,即每年的平均死亡人数) 很多情况下,分布都非常适合。...通常用下表来总结此属性, 上表的对角线非常有趣。似乎某种程度上趋向极限值(此处为63.2%)。n年内观察到的事件数量具有二项式分布,其概率为 ,将收敛到参数为1的分布。...稀有概率与分布 计算稀有事件的概率时,分布不断出现。例如,50年的时间里,至少有一次核电厂发生事故的可能性。假设在反应堆中发生事故的年概率   很小,例如0.05%。...50年内发生超过80个反应堆的事件的概率是 当然,线性近似是不正确的 另一方面 > > [1] 0.1812733> [1] 0.1812692 这是具有参数为的分布 时为零  的概率

1.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

R语言从入门到精通:Day13

图5展示了一部分数据的分布特征。从图中可以清楚地看到因变量的偏倚特性以及可能的离群点。同时,药物治疗下癫痫发病数似乎变小了,且方差也变小了(分布,较小的方差伴随着较小的均值)。...(事实上,所有的建模分析,观察数据分布特点都是必不可少的步骤,本次教程的两个示例我们都保留了这一步,而在实际的建模分析需要按照数据分布特点来选择不同模型拟合数据,否则很容易事倍功半。)...同样,还需要评价模型的过度离势。分布的方差和均值相等。当响应变量观测的方差比依据分布预测的方差大时,回归可能发生过度离势。...同样的poisson回归也有很多扩展的形式,如时间段变化的poisson回归(需要使用glm()函数的offset选项)、零膨胀的回归(pscl包的函数zeroinfl()可做零膨胀回归)、...稳健回归(robust包的函数glmRob()可以拟合稳健广义线性模型,包含稳健回归,当存在离群点和强影响点时,该方法会很有效。)。

1.6K20

R语言非线性回归和广义线性模型:、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享

GLM是一种灵活的统计模型,适用于各种数据类型和分布,包括二项分布分布和负二项分布等非正态分布。...此外,我们处理的是计数数据,它具有自己的分布,即分布。然而,如果我们坚持使用lm进行分析会怎样呢? train_lm <-......odel(train_lm) 预测值和观测值之间不匹配。...部分原因是这里的响应变量残差不是正态分布的,而是分布,因为它是计数数据。 回归 具有误差的广义线性模型通常具有对数链接,尽管也可以具有恒等链接。...geom_col(position = position_dodge()) 上面显示了两个分布,一个均值为5,另一个均值为20。请注意它们的方差如何变化。...忽略异常值测试,因为更详细的观察我们发现没有异常值。 我们还可以查看预测与量化残差图。

61320

R语言和Python过程扩展:霍克斯过程Hawkes Processes分析比特币交易数据订单到达自激过程时间序列|附代码数据

描述事件计数到达的最基本方法,例如上面的时间序列,是过程 ,有一个参数λ。过程,每单位时间的预期事件数由一个参数定义。这种方法被广泛使用,因为它非常适合大量数据,例如呼叫中心的电话到达。...下图比较经验计数(来自本文的第一个图)和拟合的综合强度。从图上看,这似乎是一个相当好的拟合。请注意,历史强度往往高于拟合的强度。...这导致大量的交易(同一秒内)失去订单,这可能会影响跳跃的大小。拟合优度评估拟合优度的方法有很多种。一种是通过比较AIC同质模型的值,如上面的 R 总结中所示,我们的霍克斯模型更适合数据。...事件间时间的对数图,或者我们的案例,对指数分布的QQ图,证实了这点。下面的图显示了一个很好的R2拟合。现在我们知道该模型很好地解释了到达的聚类,那么如何将其应用于交易呢?...----本文摘选 《 R语言和Python过程扩展:霍克斯过程Hawkes Processes分析比特币交易数据订单到达自激过程时间序列 》 ,点击“阅读原文”获取全文完整资料。

1.3K30

广义线性模型应用举例之回归及R计算

广义线性模型应用举例之回归及R计算 在前文“广义线性模型”,提到广义线性模型(GLM)可概括为服务于一组来自指数分布族的响应变量的模型框架,正态分布、指数分布、伽马分布、卡方分布、贝塔分布、伯努利分布...生物学数据很多都是计数型数值,通常具有这些特点:(1)数值是离散的,并且只能是非负整数;(2)数值分布倾向于特定较小范围内聚集,并具有正偏态的分布特征;(3)通常会出现很多零值;(4)方差随均值而增加...在这个示例数据,观察到响应变量R. cataractae丰度分布右偏而大致呈现分布,提示使用回归(广义线性模型)可能比线性回归(一般线性模型)更有效。...首先不妨使用全部环境变量拟合与R. cataractae丰度的多元回归,本次计算过程暂且忽略离群值以及多重共线性等的影响。 #拟合广义线性模型,详情 ?...分布的方差和均值是相等的。由于拟合出的值是分布均值的估计值,回归的残差的方差应该与均值的预测值相等。因此,在对残差和拟合值作图时,随着均值预测值的增加,残差方差应该以相同的速度增加。

7.9K44

R语言Poisson回归模型分析案例

我们将首先拟合仅具有一个自变量:宽度(W)的回归模型 ?...如果是这样的话,是否违背了Poisson回归模型的模型的假设? ? 上述R程序的输出: ? 在这个模型,随机分量响应具有相同均值和方差的情况下不再具有分布。...此外,如果您运行anova(model.disp),从下面的输出我们可以看到,考虑宽度后,颜色几乎没有统计上显着的预测因子。...由于添加协变量没有帮助,过度分散似乎是由于异质性。我们可以用这些数据做些什么吗? 数据分组 我们考虑按宽度分组数据,然后拟合回归模型。这里是按W排序的数据。 ? ? ?...残差分析也显示了良好的拟合度。 我们来比较下图中的观察值和拟合值(预测值): ? R的最后两个陈述用于证明我们可以用速率数据的身份链接来拟合回归模型。

3.2K30

R语言用线性模型进行臭氧预测: 加权回归,普通最小二乘,加权负二项式模型,多重插补缺失值

直方图表明残差分布右尾的值确实存在问题。由于残差不是真正的正态分布,因此线性模型不是最佳模型。实际上,残差似乎遵循某种形式的分布。...为了很好地拟合这些观察值,截距的负值为-65.77,这就是为什么该模型低估了较大臭氧值的臭氧水平的原因,训练数据臭氧值不足。...回归 为了防止出现负估计,我们可以使用假定为分布而非正态分布的广义线性模型(GLM): plot.linear.model(pois.model, pois.preds, ozone$Ozone...因此,就测试集的性能而言,加权负二项式模型并不比加权模型更好。但是,进行推断时,该值应该更好,因为其假设没有被破坏。...为了解决模型的过度分散问题,我们建立了加权负二项式模型。尽管此模型的表现不如加权Poisson模型(R2= 0.638 ),则在进行推理时可能会更好。

1.6K20

【V课堂】R语言十八讲(十六)—广义线性模型

. ★ 简介与原理: 1.logistics回归就是将结果变量做了一个转换,我们可以理解为 将y转换成f(y),而这个f(y)所代表的含义就是1类结果的优势比的对数. 2.回归是假设Y服从分布,...知道分布的就可以知道分布的一些特性,参数λ为分布的均值和方差,将lnλ作为结果变量去拟合模型.其代表的含义为,事件发生次数的均值的对数. ★ 模型拟合: 我们先看看数据情况,如下图,数据集中的几个字段...,当然前提是服从回归的,另外,有时我们并不关心次数,只关心是否出轨,这时我们将数据进行变换,变为出轨与否,这样结果变量就服从了逻辑回归的要求,我们进行了逻辑回归拟合,....,可以观查到结果与逻辑回归类似. ★ 模型的诊断: 拟合模型时会出现这样一个情况,由于我们对y进行了变换,逻辑回归中,y是二值的我们假设服从二项分布,回归中我们假设y服从分布,当y的实际方差大于分布的期望方差时...检验:我们将分布改为类分布,二项分布family=binomial( )改为family=quasibinomial( ) ,分布family=poisson( )改为family=quasipoisson

1K90

R语言线性模型臭氧预测: 加权回归,普通最小二乘,加权负二项式模型

直方图表明残差分布右尾的值确实存在问题。由于残差不是真正的正态分布,因此线性模型不是最佳模型。实际上,残差似乎遵循某种形式的分布。...该图中,我们看到大多数数据点都以[0,50]臭氧范围为中心。为了很好地拟合这些观察值,截距的负值为-65.77,这就是为什么该模型低估了较大臭氧值的臭氧水平的原因,训练数据臭氧值不足。...回归 为了防止出现负估计,我们可以使用假定为分布而非正态分布的广义线性模型(GLM): plot.linear.model(pois.model, pois.preds, ozone$Ozone...这表明对缺失值的估算比将噪声引入数据要多得多,而不是我们可以使用的信号。可能的解释是,具有缺失值的样本具有不同于所有测量可用值的分布。...为了解决模型的过度分散问题,我们制定了加权负二项式模型。尽管此模型的表现不如加权Poisson模型([R2= 0.638 ),则在进行推理时可能会更好。

1K00

R语言Poisson回归的拟合优度检验

虽然我们希望我们的模型预测接近观察到的结果,但即使我们的模型被正确指定,它们也不会相同 - 毕竟,模型给出了观察所遵循的分布的预测平均值。...因此,为了将偏差用作拟合优度检验,我们需要弄清楚,假设我们的模型是正确的,假设下,我们预测均值周围观察到的结果中会有多少变化。...如果我们提出的模型具有参数,这意味着将偏差与参数的卡方分布进行比较。 R执行拟合优度测试 现在看看如何在R执行拟合优度测试。...首先我们将模拟一些简单的数据,具有均匀分布的协变量x和结果y: set.seed(612312) n < - 1000 x < - runif(n) y < - rpois(n,mean)...对于每一个,我们将拟合(正确的)模型,并收集拟合p值的偏差良好性。

2.1K10

R in action读书笔记(18)第十三章

13.3 回归 回归适用于在给定时间内响应变量为事件发生数目的情形。它假设Y服从分布,线性模型的拟合形式为: ? 其中λ是Y的均值(也等于方差)。...此时,连接函数为log(λ),概率分布分布。...拟合回归: ? 输出结果列出了偏差、回归参数、标准误和参数为0的检验。注意,此处预测变量p<0.05的水平下都非常显著。...13.3.1 解释模型参数 回归中,因变量以条件均值的对数形式ln(λ)来建模。与Logistic回归中的指数化参数相似,模型的指数化参数对响应变量的影响都是成倍增加的,而不是线性相加。...纵向数据分析,重复测量的数据由于内在群聚特性可导致过度离势 13.3.3 扩展 1. 时间段变化的回归 2. 零膨胀的回归 3.稳健回归

1K10

论文Express | 德国本届世界杯胜算最大?帕绍大学基于ELO评级预测

2018年3月28号排名最高的5个球队的ELO评级如下: 下面我们展示了四个更加复杂的模型,在这些模型,(G_A,G_B)为二维分布随机变量,(G_A,G_B)的分布将取决于A球队和B球队以及两个队伍的...独立回归模型 在这个模型我们假设G_A和G_B分别是参数为λ_A|B和λ_B|A的独立分布变量。我们通过A和B的ELO分数进行回归来估计λ_A|B和λ_B|A。...类似的,下图表示公式(2.2)的回归结果: 拟合优度检验 我们对所有参赛队伍的(2.1)和(2.2)回归进行拟合优度检验,对于任意一支队伍T,我们计算它的χ^2统计量: 其中,n_T是T的比赛场数...,x_i是T比赛i的进球数目,μ^_i是估计的回归均值。...2018年世界杯预测结果: 独立回归模型预测结果 嵌套回归模型预测结果 二维回归模型预测结果 对角膨胀回归模型预测结果 桑基图 我们用桑基图展示了嵌套分布的预测结果,如下图所示。

56930

分布 二项分布 正态分布之间的联系,与绘制高斯分布

2.实际运用当 n 很大时一般都用正态分布来近似计算二项分布,但是如果同时 np 又比较小(比起 n来说很小),那么用分布近似计算更简单些,毕竟分布跟二项分布一样都是离散型分布。...一、分布 日常生活,大量事件是有固定频率的。...分布就是描述某段时间内,事件具体的发生概率。 ?        上面就是分布的公式。...分布的图形大概是下面的样子。 ?        可以看到,频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。...python画正态分布直方图 通过numpy构造正太分布数据,之后画图,可以通过size大小来调节数据的正太分布效果 import numpy as np import matplotlib.mlab

1.4K50

最大似然估计(MLE)入门教程

它是一种解决建模和统计中常见问题的方法——将概率分布拟合到数据集。 例如,假设数据来自(λ)分布,在数据分析时需要知道λ参数来理解数据。...最后,如果数据来自的分布具有密度函数 f(x),例如分布, 那么似然函数表示为 对于上面的分布的例子,似然函数将是 总之,似然函数是作为给定分布参数的函数给出的观测数据的联合概率。...分布示例 我们继续使用上面已经建立的分布作为示例。给定数据集X₁…Xₙ,这是i.i.d.,我们认为它来自(λ)分布,λ的MLE是多少?分布的λ参数的最大似然估计是什么?...总结 MLE 是一种技术,可以生成对要拟合数据的任何分布的参数的最可能估计值。估计值是通过最大化数据来自的分布的对数似然函数来计算的。...最后还使用了一个从分布计算 MLE 的示例,并解释了 MLE 的两个重要属性,即一致性和渐近正态性。希望这对任何学习统计和数据科学的人有所帮助!

68210

最大似然估计(MLE)入门教程

它是一种解决建模和统计中常见问题的方法——将概率分布拟合到数据集。 例如,假设数据来自(λ)分布,在数据分析时需要知道λ参数来理解数据。...最后,如果数据来自的分布具有密度函数 f(x),例如分布: 那么似然函数表示为: 对于上面的分布的例子,似然函数将是: 总之,似然函数是作为给定分布参数的函数给出的观测数据的联合概率。...分布示例 我们继续使用上面已经建立的分布作为示例。给定数据集X₁…Xₙ,这是i.i.d.,我们认为它来自(λ)分布,λ的MLE是多少?分布的λ参数的最大似然估计是什么?...总结 MLE 是一种技术,可以生成对要拟合数据的任何分布的参数的最可能估计值。估计值是通过最大化数据来自的分布的对数似然函数来计算的。...最后还使用了一个从分布计算 MLE 的示例,并解释了 MLE 的两个重要属性,即一致性和渐近正态性。希望这对任何学习统计和数据科学的人有所帮助! 编辑:黄继彦

1.1K30

R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断|附代码数据

马尔科夫链蒙特卡洛(MCMC)是一种抽样方法,允许你不知道分布的所有数学属性的情况下估计一个概率分布。它在贝叶斯推断特别有用,因为后验分布往往不能写成表达式。...一个包含公式变量的数据框。此外,还有一个可选的先验参数,它允许你改变默认的先验分布。stan()函数读取和编译你的stan代码,并在你的数据集上拟合模型。stan()函数有两个必要参数。文件。...GIBBS 吉布斯采样器估计变点指数分布分析过程车站等待时间R语言马尔可夫MCMC的METROPOLIS HASTINGS,MH算法抽样(采样)法可视化实例python贝叶斯随机过程:马尔可夫链...Hastings采样和贝叶斯回归Poisson模型Matlab用BUGS马尔可夫区制转换Markov switching随机波动率模型、序列蒙特卡罗SMC、M H采样分析时间序列R语言RSTAN...:用rstan建立线性回归模型分析汽车数据和可视化诊断R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例R语言贝叶斯Poisson

1.9K00

R语言参数检验 :需要多少样本?如何选择样本数量

将正态分布拟合到采样均值 为了研究满足t检验要求所需的样本数量,我们迭代各种样本量。对于每个样本大小,我们从几个分布抽取样本。然后,计算样本的平均值,并将正态分布拟合到平均值的分布。...每次迭代,我们记录描述正态分布与采样均值拟合程度的对数似然。当对数似然变为正时,我们将考虑采样均值接近正态分布。...拟合的概率 调查结果,我们可以看到一些分布似乎比其他分布更快地接近正态分布: print(result) ## Sample_Size Beta Normal Chi...正态分布,卡方分布分布样本大小分别为20,50和100时产生正态分布均值。最后,学生分布的方式永远不会正常,因为具有一个自由度的分布具有无限的峰度(非常重的尾部),使得中心极限定理不成立。...但请注意,从目视检查来看,平均值的初始贝塔分布似乎不比正态分布更正常。所以这个结果可能是用一粒盐。

64710

数据并非都是正态分布:三种常见的统计分布及其应用

然而,体重减轻通常不会呈线性发展,使用更复杂的数学模型,如回归,可能会更加贴近真实情况。 探讨体重减轻的模型时,我们通常会遇到各种统计分布,其中最常见的是正态分布分布。...处理计数数据,如一定时间内的体重变化次数时,分布则显得更为合适。分布用于描述固定时间或空间内发生的独立事件的数量,适用于预测罕见事件。...应用:正态分布自然和社会科学中极为常见,用于描述误差、衡量分数、身高、血压等自然现象和人类特征。 分布 分布是以法国数学家的名字命名,于1837年引入。...形态:分布是一种离散分布,用于描述固定时间或空间内发生的独立事件的次数。 参数:由一个参数 λ(事件发生的平均率)决定,λ越大,分布越平滑接近对称形态。...例如,交通领域,分布可以用来预测一定时间内通过某一点的车辆数。 卡方分布则主要用于分类数据的统计测试,如拟合优度测试和独立性测试。

10710

R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资|附代码数据

(ϵi) 以恒定方差正态分布。.... - wage, dta = wge)​编辑完整线性模型的上述总结表明,自变量的许多系数统计上并不显着(请参阅第 4 个数字列的 p 值)。...Metropolis Hastings采样和贝叶斯回归Poisson模型贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据R语言RSTAN MCMC:NUTS...聚类用户画像贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间R语言Metropolis Hastings采样和贝叶斯回归...MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例R语言贝叶斯Poisson-正态分布模型分析职业足球比赛进球数随机森林优化贝叶斯预测分析汽车燃油经济性

85620
领券