首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何利用R取概率与大小成正比的不等概率样本?

如何利用R取概率与大小成正比的不等概率样本?
EN

Stack Overflow用户
提问于 2017-12-03 02:39:34
回答 2查看 1.3K关注 0票数 2

我很少有编程经验,但我正在从事一个统计项目,并希望生成一个不相等的概率样本,其中一个单元的包含概率基于其大小(PPS)。

基本上,我有两个数据集:

  • ds1列出了美国的州和我试图估计的参数
  • ds2有每个州的人口规模。

我的问题:

  1. 我希望使用R从第一个数据集中选择一个随机样本,使用基于每个状态的总体(第二个数据集)的包含概率。
  2. 还有什么方法可以用R来计算这些广义不等概率估计公式吗?

也只是对公式的注记: pi_i是包含概率,pi_ij是联合包含概率。

EN

回答 2

Stack Overflow用户

发布于 2017-12-03 02:47:29

是的,这叫做加权抽样。只需将权重设置为状态大小,严格地说,您甚至不需要通过1/sum(sizes)来规范它们,尽管这始终是一个很好的实践。上面有大量重复的帖子,说明如何进行加权抽样。

唯一微小的复杂之处在于,您需要对数据集进行join() ds1, ds2。告诉我们你尝试过什么代码,如果有问题的话。建议您使用dplyrdata.table

你的第二个问题应该作为一个单独的问题来问,并且是一个主题之外的问题,或者至少不会得到很好的回答--最好在姐妹网站CrossValidated上问一些统计问题。

票数 0
EN

Stack Overflow用户

发布于 2017-12-03 02:51:48

在R- pps中有一个相同的包,文档是这里

另外,还有一个名为这里的文件的软件包,名为“调查”。

我不知道这两者有什么区别,也没有亲自使用过。希望这就是你要找的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47614750

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档