前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你真的懂分数吗?(五)——概率与期望

你真的懂分数吗?(五)——概率与期望

作者头像
magic2728
发布2023-09-24 08:47:06
1810
发布2023-09-24 08:47:06
举报
文章被收录于专栏:MatheMagicianMatheMagician

今天,我们进入本系列最后一篇,来看看在一般的随机变量的概率描述中,分数是怎么建模,如何起作用的。

倒数与概率

倒数本身的定义不足为奇,定义为乘法的逆元,即把整环扩展成交换除环时引入的逆元操作。当分数理解就是1个单位作为整体时,分成n份时候的大小。这个场景倒是常见,比如切一个西瓜,分1个苹果等等,但是现实中,也不那么强调严格的均分,单单为这个场景设计一个概念似乎有些多余。

但是,在交换除环的结构中,倒数正是其加法逆元求解的值,是非常重要的引入除法和分数作为逆运算的基本定义。而在应用中,我们在概率计算的时候,古典概型or几何概型,或者是无条件的最大熵的均匀分布假设下,计算出来单个事件的概率就是1 / n,刚好是n的倒数。而我们对小数的敏感显然不如直接告诉我们n,即平均是n次发生1次,是一个等价于n个古典概型样本中的1个的发生概率。这样理解就直观了,甚至可以联想起来是多大一袋子苹果抽取指定苹果的画面来,或者它刚好也类似于前面说的赌博的机会比的说法,仍然以1为标准分子,虽然这里早就没有等分的分数原始模型的概念了。

另外,对这样的概率求信息的时候,直接就是logn了,非常直观,这直接就变成编码的理想bit数长度了。甚至还有perplexity这样的概念,是2 ^ H(x),直接等价于一个有这么多选项的均匀分布的分布的混乱程度。在语言模型里就等价于均匀词数,其分布更宽,是更好理解的标度。

当然,直接按照百分数的标度来理解概率,或者用小数表达也一样,这都没什么不好。不过以1为分母的表达,倒是反而给了我们概率多大,或者信息论上大约需要多少bit来存储这样的概念上更多的信息,可以互相借鉴使用。

平均值与期望

除了以上和频率概率bool随机变量伯努利分布相关的1以内的量,现在尝试扩展到一般随机变量看看。我们经常用一个叫平均值的统计量来估计一个分布的期望,并且证明了它有很好的估计性质(一致,有效,无偏等)。但我们如果仔细探寻一下分数的原始定义和这里的用法,会发现其实已经产生了微妙的偏差。比如,我说:平均每个心血管病人放了1.5个支架。看起来这句话平平无奇,我要是发出疑问你都觉得我是不是思维能力有问题,这不就是1.5那么多的意思吗,比1个多,比2个少,刚好在中间呗。但这些都是模糊的理解,不妨真的死理性派一下。

因为支架在每个病人上放置的个数是整数,因此,这个实际上是指的把这个随机变量在整数空间,然后估计出来的数学期望而已,不是真的这么多个,也没人实现这个数。而从估计量本身计算公式的角度上来说,n / m是m个人分n个支架的意思,而且并不是均匀分配的,每个整数也分不开,因此这里1.5只是用一个分数来表达这个实际为整数空间内的随机变量的大小概念,而并没有了真正的均匀分配的意思。而我们只是用了分数的计算法则计算了在这个空间上的值,值产生大脑对其大小的感知,进一步来对每个病人身上会有多少支架形成感性判断。看到了吧,已经是感性层面了,虽然这些细节你没想过,但不妨碍根据这个1.5作出判断和决策,这就是数学有时候无用的地方,推导得很开心,不顾现实的艺术罢了。

XX率其实是这种平均值统计量的特例,即bool变量,其均值在0~1之间。比如:应消耗30粒,已消耗28粒,误差率2 / 30。这里也绝不是说每天都平均少吃了2 / 30,也不是1 / 15,毕竟一粒药根本就不会被掰开吃,投篮命中率也是类似的一起,你是投不进半个球的。这里仍然只是用这个数来作为一个数字特征,统计量对参数的估计,来给出一个定量判断值,早就没有分数均匀分配,还能约分等价的意思了。

即使被估计的对象不要求是整数,比如身高的平均值来估计总体身高的期望,这表达的也不是说170.18cm中的170cm每个人先得了,然后18 / 100 = 9 / 50,把1cm分成2mm一份,每人都恰好能分9份的意思。它依旧是用分数的计算方法提供一个这个法则下计算的结果,来提供一种总体大小估计的数值度量,其原始均分的含义,早就烟消云散了。留下的,只剩下标准度量形成数值感知,以及进制小数作为标准分数的近似表达作用了。

结语

好了,以上就是我以数学模型视角来拆解分数这一基础数学概念并联系到实际生产生活中的应用的全部内容了。我们从分数的数学模型定义开始,从最简分数的意义开始,逐步介绍了表示1以上的带分数和以内的百分数的心理模型,还有和进制绑定的小数;然后进入概率统计领域,首先是最基础的赔率和机会比,再是一般意义下的概率和期望。看到其中每一个细节处对分数的使用,都不是理想化而有很多细微的偏差,但正是这些偏斜使得在特定领域上被恰到好处地使用。

不知道你在生活中还看到分数以怎样的模式被使用?欢迎留言告诉我!

希望你看了这些文字,能够偶尔心中一喜,一惊,一震,对啊,原来是这样!

我就心满意足了。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-09-22 18:08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MatheMagician 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档