首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何在R的“调查”包中按年龄组复制SUDAAN 75%和95%置信区间?

在R的“调查”包中,可以使用svyby()函数按年龄组复制SUDAAN 75%和95%置信区间。

首先,确保已经安装了“调查”包,可以使用以下命令安装:

代码语言:txt
复制
install.packages("survey")

然后,加载“调查”包:

代码语言:txt
复制
library(survey)

接下来,假设你已经创建了一个名为survey_design的调查设计对象,可以使用以下命令按年龄组复制SUDAAN 75%和95%置信区间:

代码语言:txt
复制
age_groups <- c("18-25", "26-35", "36-45", "46-55", "56+")

# 复制SUDAAN 75%置信区间
sudaan_75 <- svyby(~variable, ~age_group, design = survey_design, FUN = svyquantile, quantiles = c(0.75))

# 复制SUDAAN 95%置信区间
sudaan_95 <- svyby(~variable, ~age_group, design = survey_design, FUN = svyquantile, quantiles = c(0.95))

在上述代码中,variable是你要计算置信区间的变量名,age_group是按年龄组进行分组的变量名,survey_design是你的调查设计对象,FUN = svyquantile表示使用svyquantile()函数计算置信区间,quantiles = c(0.75)表示计算75%置信区间,quantiles = c(0.95)表示计算95%置信区间。

最后,你将得到两个数据框,sudaan_75sudaan_95,它们包含了按年龄组复制的SUDAAN 75%和95%置信区间的结果。

请注意,以上答案是基于R的“调查”包进行回答的,关于腾讯云的相关产品和产品介绍链接地址,由于题目要求不能提及具体的云计算品牌商,因此无法给出相关链接。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

总体参数估计(概念)

举例:到底北京人同意北京大力发展轨道交通,由于不大可能询问所有的一千多万北京市民,人们只好进行抽样调查以得到样本,并用样本同意发展轨道交通比例来估计真实比例,从不同样本得到结论也不会完全一样。...虽然真实比例在这种抽样过程永远不可能知道,但有可能知道估计出来比例真实比例大致差多,从数据得到关于总体参数一些结论过程就叫做统计推断。 总体代表人们所关心那部分世界。...再例如,在调查某机构民意检测,该候选人支持率在75%,误差是3%,置信度是95%,这样说法意味着下面三点:   1、样本支持率为75% ,这是用样本比例作为对总体比例点估计。   ...这样得到区间被称为总体比例p置信度为95%置信区间(confidence interval)。这里置信度又称置信水平或置信系数。...希望分别得到这两个总体均值标准差点估计(即样本均值样本标准差)个子总体均值95%置信区间,利用R语句:   w = read.table("expend.txt",header = T) #读入数据

79720

美国43.6%女性24.8%男性遭遇过性暴力!这份报告还讲了这些…

《全国亲密伴侣性暴力调查:2015年数据简报》,并将这份简报部分内容翻译了一下。...国家亲密伴侣性暴力调查(NISVS)于2010年由疾病预防控制中心首次启动,旨在评估美国成年男女中性暴力、跟踪和亲密伴侣暴力受害情况。 这份简报介绍了2015年NISVS重点数据相关内容。...女性受害者首次遭强奸或强奸未遂时年龄 ̶ NISVS 2015年龄组占比 %95% 置信区间受害者人数估值18岁以下43.2(39.7, 46.8)11,027,00010岁以下12.7(10.4...男性受害者首次遭强奸及被强迫插入他人时年龄 ̶ NISVS 2015 强奸 (完成或未遂)被强迫插入他人 (完成或未遂)年龄组占比95%置信区间受害者人数估值占比95%置信区间受害者人数估值18岁以下...心理攻击:包括表达性攻击(辱骂、羞辱或侮辱)强制控制,其中包括监视、控制或威胁亲密伴侣行为。 2. 受害者数据 ?

65160

数学建模-二胎政策对中国人口影响

因此统计年龄组7个年龄组,不考虑其它年龄组不具备生育能力。生育率是写者查阅多方面资料,综合考虑经济。环境等各个因素如果得到。...进一步将表1表2数据整理得到基年数据(2010): 年龄组 总人数 死亡率 出生率 0-4 75532610 1.32 0 5-9 70881549 0.30 0 10-14 74908462 0.31...实行单独二胎政策,对出生率改变仅是通过预測得到 2. 全面二胎政策,对出生率改变也是通过预測得到 模型改进: 能够通过设计一份问卷调查。...调查二胎政策对独生子女生育意愿影响 七、模型推广 尽管单独二胎政策对全国独生子女出生意愿影响非常难得到,可是详细到省份。...发现本站有涉嫌侵权/违法违规内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

1.3K10

R语言对苏格兰独立民意调查Meta分析

此函数结合了调查数字(不包括未定数)数量,以给出对选民平均比例总体估计。进行两项分析,一项是所谓固定效应分析,第二项是随机效应分析。 结果 下面所谓森林图显示了分析结果。...投票总体估计比例为(在随机效应模型下)为48.72%,95置信区间为46.82%至50.62%。...因此,仅基于这六个民意调查(并参见下面的警告),估计投票比例是低于50%,而置信区间显示数据与“真实”比例一致,高于50 %。...来自不同研究95置信区间与每个基本上重叠,说明了在每个研究给出(相对)小数量点,结果微小差异可能纯粹是由于抽样误差。 ? 这里提出简单分析可能存在许多缺陷。...R输出 对于那些感兴趣的人,如下所示是分析R输出,给出每个民意调查比例,每个民意调查95%CI,分配给每个民意调查权重(在固定随机效应分析),估计I ^ 2(可归因于真实异质性变异比例)

36710

R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化

然后,我们将详细说明自举法bootstrap原理应用,以及如何利用R语言进行自举法bootstrap分析。接着,我们将探讨假设检验概念步骤,并展示如何使用R语言进行假设检验分析。...最后,我们将介绍数据可视化重要性,并演示如何使用R语言生成图表可视化结果。...他们收入最低 25%的人收入为 21 065 元(与自雇者相同),75%的人收入为 76 600 元,低于自雇者。他们平均家庭收入为 56 165.08 元。...我们将用 95%置信区间来估计典型家庭收入差异,并用标准误差法进行 5%显著水平假设检验。如前所述,所有条件均已满足。...第五部分:结论 经过分析推论,我们对 2012 年得出以下结论(每个推论后所述): 数据提供了令人信服证据,表明工作满意度确实因受访者就业状况(自营职业为他人工作)而异。

28700

ISME+Microbiome:Sloan随机性方法发展及代码

EM:Sloan随机性模型方法 不难发现,从EM文章到2020年这两个应用之间还是有一定距离最开始方法没有拟合R2置信区间。 这篇ISME是基于Sloan方法进一步发展。...摘要: 这篇ISME调查了与斑马鱼肠道相关微生物群落。将观察到群落组成和在宿主间分布与中性构建模型预测进行了比较,该模型假设群落构建完全由偶然性扩散驱动。...随着寄主从幼虫发育到成虫,该模型对观察到微生物分布拟合度降低,这表明随着寄主成熟,非中性过程(微生物-微生物相互作用、主动扩散或寄主选择)相对重要性增加。...方法: 在Sloan基础上,在R采用非线性最小二乘拟合法对该参数进行拟合(minpack.lm)。 使用HMisc Wilson score interval计算模型预测比例95%置信区间。...作者贴心将数据代码放在了参考材料中,并写好了注释。不需要我再写了。 注意输入是重抽之后OTU表,行为样本,列为OTU。

1.3K41

R in action读书笔记(17)第十二章 重抽样与自助法

12.4 置换检验点评 除coinlmPerm外,R还提供了其他可做置换检验。perm能实现coin部分功能,因此可作为coin所得结果验证。...无需假设一个特定理论分布,便可生成统计量置信区间,并能检验统计假设。比如,你想计算一个样本均值95%置信区间。假设均值样本分布不是正态分布: (1) 从样本随机选择10个观测,抽样后再放回。...(3) 重复12一千次。 (4) 将1000个样本均值从小到大排序。 (5) 找出样本均值2.5%97.5%分位点。此时即初始位置最末位置第25个数,它们就限 定了95%置信区间。...12.6 boot 自助法 boot扩展了自助法重抽样相关用途。可以对一个统计量(中位数)或一个统计 量向量(如一列回归系数)使用自助法. 自助法有三个主要步骤。...boot()函数返回对象所含元素 t0 从原始数据得到k个统计量观测值 t 一个R × k矩阵,每行即k个统计量自助重复值 你可以bootobject$t0bootobject$t这样来获取这些元素

1.3K20

R 与 Python 双语解读统计分析基础

本系列文章主要目的是结合 R Python 两种语言代码来理解统计分析一些概念方法。 主要是理解相关数学概念,不偏倚语言。...R 语言有很多可绘制统计信息,但这里主要采用 R 语言内置函数,偶然使用其他更酷 ggplot2 等。 1单组数据概要统计 这里主要看一维数组情况,也就是单组数据。...数据集 juul 来自 Anders Juul 进行一项调查,该调查涉及一组健康人(主要是小学生)血清 IGF-I(类胰岛素生长因子)。...通过将 breaks 指定为向量而不是数字,则可以非均匀地控制间隔划分。下面数据包含了一个年龄组划分事故率示例。...这些是 0-4、5-9、10-15、16、17、18-19、20-24、25-59 60-79 岁年龄组计数。

2K10

深度解析机器学习置信区间(附代码)

在这篇教程,你会了解置信区间以及如何在实践中计算置信区间。...相反,对于总体参数,平均值,标准差等等,置信区间提供了一个界限。 在应用机器学习,我们可能想在展示一个预测模型能力时使用置信区间。...选择95%置信度在展现置信区间时很常见,但是其他不那么常见值也会被使用,比如90%99.7%。实践,你可以使用任何喜欢值。 ?...例如,如果一个模型在75情况对类别结果做出了正确预测,则模型分类准确率为75%,计算公式如下: accuracy = total correct predictions / total predictions...你探索了置信区间以及如何在实践中计算置信区间

4.1K30

统计简单学_估计

估计平均数时 估计比率时 回顾 R语言实践 抽样分布与中央极限定理 抽样分布 从群体抽取样本,样本统计量几率分布称为抽样分布。...信赖区间含义 95%信赖区间含义是:样本数目不变情况下,做一百次实验,得到一百个置信区间,共有95置信区间包含了群体真值。置信度为95%。...因为100个置信区间95个都会包含真值,所以我们用95%置信度置信区间包含真值可能性就很大。 ? 信赖区间与z值图 ? 例子 ? 方差未知 t分布区间估计公式 ? t分布简介 ?...R语言实践 #第一组为均值0正态分布,第二组为均值0.1正态分布 data = rnorm(100) data2 = rnorm(100,mean = 0.1) #画数据密度图直方图 plot...(data);qqline(data,col=2) qqnorm(data2);qqline(data2,col=2) #对数据平均数用t检验,查看95%置信区间以及平均数显著程度。

89220

R语言中Stan概率编程MCMC采样贝叶斯模型

它根据指定模型,数据设置从后验分布采样。...# 存储编译stan模型 现在,我们可以从后验编译模型样本。...在此,行名称表示估计参数:mu是后验分布平均值,而tau是其标准偏差。etatheta条目分别表示矢量ηθ估计值。这些列表示计算值。百分比表示置信区间。...例如,教练计划总体效果95%可信区间μ为[-1.27,18.26]。由于我们不确定平均值,因此θj95置信区间也很宽。例如,对于第一所学校,95置信区间为[−2.19,32.33]。...我们可以使用以下plot 函数来可视化估计不确定性 : 黑线表示95间隔,而红线表示80%间隔。圆圈表示平均值估计。

22330

R语言中Stan概率编程MCMC采样贝叶斯模型|附代码数据

它根据指定模型,数据设置从后验分布采样。... 存储编译stan模型 现在,我们可以从后验编译模型样本。...在此,行名称表示估计参数:mu是后验分布平均值,而tau是其标准偏差。etatheta条目分别表示矢量ηθ估计值。这些列表示计算值。百分比表示置信区间。...例如,教练计划总体效果95%可信区间μ为[-1.27,18.26]。由于我们不确定平均值,因此θj95置信区间也很宽。例如,对于第一所学校,95置信区间为[−2.19,32.33]。...我们可以使用以下plot 函数来可视化估计不确定性  : 黑线表示95间隔,而红线表示80%间隔。圆圈表示平均值估计。

45400

Broom |tidy up a bit,模型,检验结果一键输出!

#载入R library(broom) ??...broom #查看broom用法 broom主要提供如下三种结果整理函数 tidy: 返回模型统计结果数据框; augment: 返回模型参数并增加预测残差等模型结果; glance: 返回模型一行重要结果...结果如上,只需要将上面的P值,R squared,Adjusted R squared等关心模型结果,用时间耐心“精确”复制粘贴出来就可以了!...看起来summary(lmfit)$coef差不多,但还是有区别的: coef(summary(lmfit)) ,terms保存在rawname; 列名为Pr(>|t|)而不是p.value; 2...基础方法提取 #通过函数来提取关键结果 coef(summary(fit_cox)) #提取HR95%置信区间 exp(coef(fit_cox)) #提取HR95%置信区间 exp(confint

94140

R语言贝叶斯广义线性混合(多层次水平嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据|附代码数据

在频率论模型,使用 95% 不确定性区间(置信区间)背后想法是,在重复抽样情况下,95% 结果不确定性区间将覆盖真实总体值。...这让我们可以说,对于给定 95% 置信区间,我们有 95% 置信区间包含真实总体值。然而,它不允许我们说置信区间95% 机会包含真实总体值(即 频率论不确定性区间不是概率陈述)。...每个密度深蓝色线表示点估计,而浅蓝色区域表示 95% 可信区间。我们可以很容易地看到, SEX  PPED 都是有意义预测变量,因为它们置信区间不包含零,并且它们密度具有非常窄形状。 ...此外,即使是结果(即留级)预测变量(性别、学前教育、SES)之间关系,在不同学校也可能不同。还要注意是,MSESC变量存在缺失值。使用多层次模型可以适当地解决这些问题。 以下图为例。...在三个预测因子,SEXPPED置信区间(由密度浅蓝色阴影区域表示)显然不包含零。因此,它们应该被视为有意义预测因素。

1.5K30

R语言贝叶斯广义线性混合(多层次水平嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据

在频率论模型,使用 95% 不确定性区间(置信区间)背后想法是,在重复抽样情况下,95% 结果不确定性区间将覆盖真实总体值。...这让我们可以说,对于给定 95% 置信区间,我们有 95% 置信区间包含真实总体值。然而,它不允许我们说置信区间95% 机会包含真实总体值(即 频率论不确定性区间不是概率陈述)。...每个密度深蓝色线表示点估计,而浅蓝色区域表示 95% 可信区间。我们可以很容易地看到, SEX PPED 都是有意义预测变量,因为它们置信区间不包含零,并且它们密度具有非常窄形状。...此外,即使是结果(即留级)预测变量(性别、学前教育、SES)之间关系,在不同学校也可能不同。还要注意是,MSESC变量存在缺失值。使用多层次模型可以适当地解决这些问题。 以下图为例。...在三个预测因子,SEXPPED置信区间(由密度浅蓝色阴影区域表示)显然不包含零。因此,它们应该被视为有意义预测因素。

2.7K20

【数据分析】R语言中用自助法求统计量置信区间

R中进行自助法是利用boot扩展,其流程如下: 编写一个求取统计量自定义函数 将上面的函数放入boot()函数中进行运算,得到自助法结果 用boot.ci()函数求取置信区间 让我们用mtcars...其中我们感兴趣是判定系数R-square,希望用自助法求它95%置信区间。...------------------ 载入boot扩展,将随机种子设为1234,以方便得到相同结果,再利用boot函数得到结果results,其中R表示重复抽样得到1000个样本 -------...results这个数据结构包括了原始样本统计量(results$t0)再抽样样本统计量(results$t0),上图左侧直方图表示了再抽样样本统计量经验分布,其中虚线表示了原始样本统计量...PPV课大数据ID: ppvke123 (长按可复制) 大数据人才摇篮!

4.5K60

贝叶斯分位数回归、lasso自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据|附代码数据

自引入以来,分位数回归一直是理论界非常关注的话题,也在许多研究领域得到了大量应用,计量经济学、市场营销、医学、生态学生存分析(Neelon等,2015;Davino等,2013;HaoNaiman...为了说明问题,该数据集贝叶斯分位数回归模型(可以拟合如下)。 rq(血清浓度~年龄, tau=0.5) 摘要函数提供估计值95%置信区间 绘制数据,然后将五条拟合RQ线叠加在散点图上。...叠加在该图上是{.05, .25, .50, .75, .95}RQ线(左图) RQ线(左图)RQ曲线(右图)。 图可以用来评估吉布斯采样向平稳分布收敛情况。...该数据集调查了等待根治性前列腺切除术病人前列腺特异性抗原(lpsa)水平和八个协变量之间关系。...当τ=0.50时,函数可以用来获得Tobit 分位数回归后验平均值95%置信区间。  结论 在本文中,我们已经说明了在分位数回归(RQ)中进行贝叶斯系数估计变量选择。

30300

Nature: P值到底能不能用?

避免这种“二分法”一个原因是,所有的统计数据,包括P值置信区间,在不同研究自然会有所不同,而且往往达到惊人程度。...Link: https://www.nature.com/articles/nature.2016.19503 美国统计协会(ASA)发布一份声明警告说,P值滥用正在导致无法复制研究结果数量增加...(a) 100个单样本t检验95%置信区间,样本规模n = 100,均值0,标准差= 1。区间统计显著性递增顺序排序。...(b) a预测因子个数错误(k > 0)828个案例f检验R2(上)P值(下)分布情况。...然而,为了理解效应生物学相关性,我们需要估计效应大小,例如置信区间。在上述例子,计算2 mm Hg±1 mm Hg95%置信区间将使我们能够确定缺乏生物学相关性。

73020

贝叶斯分位数回归、lasso自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据|附代码数据

自引入以来,分位数回归一直是理论界非常关注的话题,也在许多研究领域得到了大量应用,计量经济学、市场营销、医学、生态学生存分析(Neelon等,2015;Davino等,2013;HaoNaiman...为了说明问题,该数据集贝叶斯分位数回归模型(可以拟合如下)。 rq(血清浓度~年龄, tau=0.5) 摘要函数提供估计值95%置信区间 绘制数据,然后将五条拟合RQ线叠加在散点图上。...叠加在该图上是{.05, .25, .50, .75, .95}RQ线(左图) RQ线(左图)RQ曲线(右图)。 图可以用来评估吉布斯采样向平稳分布收敛情况。...该数据集调查了等待根治性前列腺切除术病人前列腺特异性抗原(lpsa)水平和八个协变量之间关系。...当τ=0.50时,函数可以用来获得Tobit 分位数回归后验平均值95%置信区间。  结论 在本文中,我们已经说明了在分位数回归(RQ)中进行贝叶斯系数估计变量选择。

30000
领券