我对多模态生物测量数据进行了混合分布拟合,以便对个体进行相应的分组(描绘一个长度测量的多模态直方图;假设每个模式代表不同的年龄队列,我可以从容易测量的长度数据中推断出年龄的数字)。
混合分布为每个人的成员关系提供了每个模式的后验概率,因此,一旦被length类绑定,一行数据可能看起来如下:
l.class freq age1 age2 age3 age5
9 41 0.2 0.25 0.3 0.25
其中l.class是长度bin,freq是个体数,age1、age2、age3和age5是与给定混合模式/年龄组关联的概率。由于这是概率,而不是比例,我想迭代每一个条目多次,以便得到一个估计的数字在年龄的每个长度桶。
我曾尝试使用sample()
在R中实现这一点,但我无法按照概率将我的头转到多个潜在组中的一个。
发布于 2014-06-01 20:40:02
x <- sample(names(data1)[3:ncol(data1)], data1$freq, replace=T, prob=c(data1[i,3:ncol(data1)]))
下面是我最后使用的方法。我想要在一个循环中运行抽样,以便用概率进行多次抽样(即1000次),所以我这样做了,然后以每个年龄组的平均样本数作为我的估计。
https://stackoverflow.com/questions/19728723
复制相似问题