我有一道数学题需要帮助。这是医学研究,但我将以果园为例。
比方说,一项在果园进行的研究考察了坏苹果的比例。研究表明:Results study
A)红苹果(坏10;好90,因此苹果坏的概率是0.10)
B)青苹果(坏苹果20;好苹果80,坏苹果概率0.20)
因此
C)所有苹果-绿色和红色(坏30;好170,坏苹果的概率为0.15)
现在,基于这项研究,我想估计我的果园里可能会有多少坏苹果。
我的果园里有1000个苹果,600个是红色的,400个是绿色的。谁能告诉我为什么下面两个估计不匹配,并建议哪一个是正确的?
选项1
1,000个苹果x坏苹果概率0.15 = 150个坏苹果
选项2
600个红苹果x坏红苹果的概率0.10 = 60个坏红苹果
400个红苹果x坏绿苹果的概率0.20 = 80个坏绿苹果
加起来是60 + 80 = 140个坏苹果。
那么,为什么会有差异,哪个估计是正确的呢?
发布于 2020-01-29 07:20:22
第二个是正确的。它是正确的,因为它将正确的概率应用于每种情况并对结果求和;EX+Y = EX + EY。第一种方法是错误的,因为它使用两个概率的未加权平均值,并将其应用于不包含相同数量的每个uses类型的样本的总体。如果农场每种都有500个苹果,这两种方法都会奏效。
编辑:基于评论,澄清:
问题是你预计会有多少个坏苹果。坏苹果的数量是一个随机变量Z。坏苹果的数量是坏的红色和坏的绿色苹果的总和。依次是随机变量X和Y,Z=X+ Y,我们想要Z,EZ的期望值,这是EX + Y,我们通过期望值的属性知道这是EX + EY。也就是说,我们可以分别计算坏红苹果的预期数量和坏绿苹果的预期数量,然后将它们加在一起,得到我们期望的坏苹果总数。这种方法基本上与使用条件概率相同,只是我们跳过了除以苹果的总数;如果我们这样做了,我们就会使用条件概率来找出得到一个坏苹果的概率,这是正确的,但不是必需的。
https://stackoverflow.com/questions/59958124
复制相似问题