前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >概率论框架再定义

概率论框架再定义

作者头像
算法之名
发布2024-06-28 09:07:50
530
发布2024-06-28 09:07:50
举报
文章被收录于专栏:算法之名算法之名

原子事件:对于离散事件不可再分的事件,如掷骰子,掷出1,2,3,4,5,6的任意一种就是原子事件。离散事件的原子事件,我们可以用下面的表格来表示。

S

K

1

原子事件a

数值1

2

原子事件b

数值2

3

原子事件c

数值3

4

原子事件d

数值4

5

原子事件e

数值5

6

原子事件f

数值6

由于对于数学来说,我们必须定量,所以我们需要给每一个原子事件一个数值,方便我们后续的计算,那么该数值用该事件在整体事件发生的可能性(possibility)来定义,该数值可以是任意值,我们用一个函数来表示

f(S)=K

通过输入一个事件S,通过函数f来计算出该事件对应数值的大小K。

对于一些包含事件(非原子事件),我们可以用对数值求和来表示

P(S)

(\sum{K})

{1,2}

数值1+数值2

{1,2,3}

数值1+数值2+数值3

{3,4}

数值3+数值4

{2,4}

数值2+数值4

这里的P(S)表示S集合的幂集(是指一个集合的所有子集(包括全集和空集)构成的集合族)。这样我们就能知道所有事件可能性的最大值,也就是所有事件的K值之和。

(max(\sum{K})=\sum_{s∈S}f(s))

同时我们也可以对数值K进行归一化

(K^*={K\over \sum_{s∈S}f(s)}∈0,1)

这里的(K^*)就是概率值了

以上都是以离散事件为根基的,但是如果是一个连续的事件,如明天的温度,我们无法确定一个原子事件,因为温度是有21.5度,21.6度,...,它是一个实数值。在连续的事件中,我们只有一个个数值点,且该数值点是不能代表一个事件的,该点的数值也不能代表可能性。

R

S

K

...

点a

数值1

...

点b

数值2

...

点c

数值3

...

点d

数值4

...

...

...

则该表格就失去了意义,我们可以重新建立一个表格

S

F δ~域

(\int{K}=P)

...

1,2

(\int{数值1,数值2})

...

1,3

(\int{数值1,数值3})

...

3,4

(\int{数值3,数值4})

...

1,2∪3,4

(\int{数值1,数值2}+\int{数值3,数值4})

...

...

...

上表中的第二列是实数集的δ~域(比幂集更小的概念,幂集本身在实数中是无穷的,无法做归一化,但δ~域会排除无穷),第一列S就是事件,第三列就是该事件发生的概率P,因为是连续的事件,所以用积分来求和。

在离散事件中,我们是用f(S)=K来求得该事件的可能性,而不是概率。而在连续事件中,我们使用F(x)=事件(-∞,x]的可能性,其中x∈R,(-∞,x]∈δ~域,F(x)就是连续型随机变量分布函数,那么概率密度函数则为f(x)=F'(x)=K,这样我们就清楚了,连续型事件的可能性就是某些点的概率密度求和(此处可以参考概率论整理(二) 中的连续型随机变量的概率密度)。

我们在连续型事件的第一张表S中的点a、点b、点c、点d,它们只是只是对它们用实数来编号,但并不代表它们本身就是数,而是样本空间,当用实数来编号的时候会有一个函数X(S)=R。

概率空间会用三个符号{Ω,F,P}来表示,其中Ω就是样本空间,即第一张表中的S;F是样本空间中生成的δ~域,它才是真正的事件,而样本空间中的单个样本并不是事件;P是F中所有元素的一个权重值,在F中的每一个元素在P中都会有一个值与其对应。由于Ω不一定是数,通过X(S)=R来转化为概率空间{R,F,P},这样我们就可以通过实数的计算来进行样本空间的分析。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档