前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机会的度量:概率和分布

机会的度量:概率和分布

作者头像
用户3003813
发布2018-09-06 14:07:57
7390
发布2018-09-06 14:07:57
举报
文章被收录于专栏:个人分享个人分享

在概率论中所说的事件(event)相当于集合论中的集合(set)。

互补事件的概率

  如果一个不出现,则另一个肯定出现的两个事件成为互补事件(complementary events,或者互余事件或对立事件).按照集合的记号,如果一个事件记为A,那么另一个记为的补集。P(A) + P(A) = 1 ,P(A) = 1 − P(A)。(初中学的吧)

比如西方赌博时常常爱用优势或赔率。如果你赢的概率为0.6,那么就说成是你有6对4的优势会赢,或者4对6的优势会输。

概率的加法

  如果两个事件不可能同时发生,那么至少其中之一发生的概率为这两个事件的概率和。比如"抛一次骰子得到5或者5点"的概率是"得到5点"的概率与"得到6点"的概率之和,即1/6 + 1/6 = 1/3。但是如果两个事件可能同时发生时这样做就不对了。

  假设抛骰子时,一个事件A为"得到偶数点"(有可能是2,4,6点),另一个事件B为"得到大于或等于3点"(有4种可能:3,4,5,6点),这样事件A的概率显然等于3/6 = 1/2,即P(A) = 1/2,而事件B的概率为P(B)=2/3.但是,"得到大于或等于3点或者偶数点"的事件的概率就不是P(A) + P(B) = 1/2 + 2/3 = 7/6了,概率怎么能够大于1呢?其实这多出来的就是A与B的共同部分的概率。

概率的乘法

  如果有一个固定电话和一个手机,假定固定电话出毛病的概率为0.01,而手机出问题的概率为0.05,那么两个同时出毛病的概率是多少呢? 上过初中的都能立马算出是0.01乘以0.05,但这种法则,仅仅在两个事件独立(independent)时才成立。如果事件不独立则需要引进条件概率(conditional probability)。

  比如三个人抽签,而只有一个人能够抽中,因此每个人抽中的机会是1/3。假定用A1、A2、A3分别代表着三种人抽中的事件,那么,P(A1)=P(A2)=P(A3)=1/3,但是由于一个人抽中,其他人不可能抽中,所以,这三个事件不独立。所以一般地在一个事件B已经发生的情况下,事件A发生的条件概率定位就为:

变量的分布

  随机变量取一切可能值或范围的概率或概率的规律成为概率分布(probability distribution,简称分布).一个概率分布是和某总体(population)也称为样本空间(sampling space)相联系的。

  在确定了抽样方法后,这个有限总体就可能与概率有关的总体有某种联系了,并且可能对诸如总体比例等进行推断。这里的总体或样本空间为一个抽象的空间,它是由某种试验的所有可能结果点组成的,这些结果的获得都服从某种概率规律。因此,一个总体(样本空间)是由一个取值范围及相连的概率所组成的。

离散随机变量的分布

  离散随机变量只取离散的值,比如骰子的点数、次品的个数、得病的人数等等。每一种取值都有某种概率,各种取值点的概率总和应该是1.当然离散变量不仅限于取非负整数值。一般来说,某离散随机变量的每一个可能取值x都相当于取该值的概率P(xi).

二项分布

  比如,每个进入某商场的顾客都有购买或不购买商品的两种可能、每个被调查的人士会支持或不支持某种观点、每一个产妇有生出或不生出男婴或女婴两种可能等等。根据这种简单试验的分布,可以得到基于这个试验的更加复杂事件的概率。

这里

为二项式系数。 这里P(x)为n次试验中成功k次的概率,p为每次试验成功的概率。不过现在很多统计学工具要统计二项分布的都已经直接实现了~

多项分布为二项分布的推广,就好比调查顾客对5个品牌的饮料的选择中,每种品牌都会以一定的概率中选,假定这些概率为p1,p2,p3,p4,p5。每次试验的结果只可能有一个,因此这些概率的和为1,即p1+p2+p3+p4+p5 = 1,在二项分布中,人们关心的是在n次实验中成功k次的概率(有了成功k次的概率,就有了失败n-k次的概率)。但是在多项分布问题中,所关心的就是在n次试验中,选择5个品牌的人数分别为m1,m2,m3,m4,m5的概率,自然,m1+m2+m3+m4+m5=n。

超几何分布

  超几何分布和有限总体的不放回抽样的实践有密切关系。比如有一批500个产品,而其中有5个次品,质量检查人员随即抽取20个产品进行检查。如果抽到的20个产品中含有2个或更多不合格产品,则整个500个产品都将会退会。那么该批产品退回的概率是多少呢? 这里就满足了超几何分布。 这是一种不放回的抽样,如果放回的话那么这个物品还可能会被抽上,那么每次抽样时得到次品的概率是一样的,等于次品的比例,这就不是超几何分布而是二项分布了。这里的产品总数为n,其中不合格产品数为k,不放回抽样的数目为N,而样本中有M个不合格的产品的概率就为:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016-01-30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档