前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >数学杂谈:限制条件下的均匀分布考察

数学杂谈:限制条件下的均匀分布考察

作者头像
codename_cys
发布于 2022-11-29 09:56:48
发布于 2022-11-29 09:56:48
73300
代码可运行
举报
文章被收录于专栏:我的充电站我的充电站
运行总次数:0
代码可运行

1. 问题描述

假设

x1,...,xn

均为

01

上的均匀分布,且满足限制条件:

x1+x2+...+xn=1

求此时

xi

的真实分布表达式。

2. 问题解答

1. 答案

限制条件下

x

的密度函数表达式如下:

fn(x)=(n1)(1x)n2

2. 解析

我们可以快速地给出推导公式为:

fn(x)=1x0dt11xt10dt2...1xt1...tn30dtn210dt11t10dt2...1t1...tn20dtn1

gn(x)=1x0dt11xt10dt2...1xt1...tn10dtn

则我们有:

fn(x)=gn2(x)/gn1(0)

gn(x)

我们可以通过递归关系

gn(x)=1x0gn1(1xt1)dt1

快速计算得到:

gn(x)=1n!(1x)n

因此,我们即可解得:

fn(x)=(n1)(1x)n2

特别地,积分即可快速得到,某一个元素要取值得到至少

τ

的概率为:

P(xτ)=(1τ)n1

3. 蒙特卡洛模拟

如果我们要对上述结论进行验证,我们可以使用蒙特卡洛模拟来对上述结论进行验证。

我们直接给出代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import numpy as np
from random import random
from matplotlib import pyplot as plt

def monte_carlo_simulate(n=5, N=10000):
    s = []
    for _ in range(N):
        while True:
            tmp = [random() for _ in range(n-1)]
            if sum(tmp) <= 1:
                s.append(1 - sum(tmp))
                break
    return s

def show_simulate(n=5, N=10000):
    x = np.linspace(0, 1, num=100)
    y = (n-1) * np.pow(1-x, n-2)
    s = monte_carlo_simulate(n=n, N=N)
    plt.figure(figsize=(15, 7))
    plt.hist(s, bins=100, range=[0, 1], density=True)
    plt.plot(x, y)
    plt.show()
    return

show_simulate(n=5, N=10000)

可以看到:

进一步的,如果我们要快速地获取符合

x

分布的随机数,也只需要做如下构造即可:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import math
from random import random

def random(k=5):
    x = random()
    z = 1 - math.pow(z, 1/(k-1))
    return z

3. 离散情况延拓

下面,我们稍微拓展一下,如果

x

不连续,是离散的情况下,那么结果如何。

我们修改问题为:

假设我们有

k

个均匀分布的离散项,取值范围为

0N

,且满足限制条件

x1+x2+...xk=N

,那么其中

x1

不小于

M

的概率是多少。

这个问题其实感觉比上述连续的情况还要简单一些,我们只需要将其视为排列组合问题即可进行解答,即视为分堆问题,将

N

个元素分到

k

个堆当中,令其中某一个堆中的元素个数不少于

M

1. 正整数的情况

首先,我们来考察一下最简单的情况,即要求每个堆中至少有一个元素,且

N,M

均为有限整数。

此时,我们要做的事实上就是在

N

个元素所构成的

N1

个间隔位置当中放入

k1

个挡板。不妨设要求的堆就是第一个堆,即第一个堆的元素个数不少于

M

个,此时,符合要求的摆放方式必然要求第一个挡板的出现位置必须要在第

M

个间隔或者之后。

因此,我们可以得到答案为:

P(x1M)=Ck1NMCk1N1

2. 整数的情况

对于整数的情况,其结果本质上是与之前正数的情况完全相同的,唯一的区别在于,挡板可以相邻,因此,我们事实上就是将

N

个元素与

k1

个挡板合在一起进行排列组合。

同样的,我们要求第一个堆当中至少包含

M

个元素,此时我们可以仿上求得答案为:

P(x1M)=Ck1NM+k1Ck1N+k1

3.

N

的情况

最后,我们考察一下

N

的情况,令

N

,且有

limNMN=τ

此时,上述两个式子的解收敛为:

limNP(x1M)=(1τ)k1

此结果就是之前讨论的连续情况下的解。

4. 误区分析

这里,其实有一个坑要注意一下,就是如果你在模拟的时候这么写作函数:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def simulate(n=5, N=10000):
    s = []
    for _ in range(N):
        t = 1.0
        for _ in range(n-1):
            t -= t * random()
        s.append(t)
    return s

此时,采样得到的

n

个点事实上也满足

ni=1xi=1

,但是如果我们将

xi

的分布画出来的话,可以注意到,

xi

的分布与

i

的取值有关,且

i

越大,采样得到的

xi

的均值越小。

我们以

n=5

为例,可以绘制得到曲线如下:

这乍看有点迷糊,其实仔细想想的话你会注意到这里的

xi

的取值概率是与开始的题目描述不一致的,原本要求的概率应该是:

P(xi=x|ni=1xi=1)

而这里模拟的概率事实上是:

P(xi=x|i1j=1xj1x)

因此就会出现两种模拟的结果不一致的情况。

而同样的,如果有读者感兴趣的话,后者事实上我们也可以很轻松地求出其概率密度函数为:

fn(xi=x)=gi1(x)gi(0)=i×(1x)i1

需要注意的是,这里的

i<n

,当

i=n

时,此时其分布与

i=n1

时相同,多多少少有那么一点点特殊。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-11-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【概率论与数理统计(研究生课程)】知识点总结4(随机变量的数字特征)
版本:1.0.1 最后更新时间:2022年11月10日 09:07 修改次数:1 历史修改内容: 1.0.1:随机变量函数的期望公式
Marigold
2023/08/23
2920
【概率论与数理统计(研究生课程)】知识点总结4(随机变量的数字特征)
大学生非数竞赛专题四 (2)
非数竞赛专题四 多元积分学 (2) 4.2 交换二重积分的次序 4.5 (北京市1994年竞赛题) 设 f(x,y) 是定义在区域 0 \leq x \leq 1,0 \leq y \leq 1 上的二元函数, f(0,0)=0 ,且在 (0,0) 处 f(x,y) 可微,求极限 \lim\limits_{x\rightarrow 0^{+}} \frac{\displaystyle\int_{0}^{x^2}dt\int_{x}^{\sqrt{t}}f(t,u)du}{1-e^{-\frac{x^2}
用户9628320
2022/11/23
2500
实变函数期末复习笔记
若A,B是非空集合,且存在双射\phi:A\rightarrow B,称A与B对等,记为A\sim B,规定\varnothing \sim \varnothing.
Hsinyan
2022/08/30
1.4K0
【概率论与数理统计(研究生课程)】知识点总结2(一维随机变量及其分布)
Marigold
2023/08/23
2630
竞赛好题暑假练习2
利用积分和级数来求一道极限问题 求极限 \begin{align*} \lim\limits_{ \begin{subarray}{l} m \to \infty\ n \to \infty\ \end{subarray} }\sum\limits_{i=1}^{m} \sum\limits_{j=1}^{n} \dfrac{(-1)^{i+j}}{i+j} \end{align*} 解:由于 \displaystyle\int_{-1}^{0}x^{i+j-1}dx=\dfrac{1}{i+j}x^{i+
用户9628320
2022/11/23
3800
『数据挖掘十大算法 』笔记二:SVM-支持向量机
C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART
百川AI
2021/10/19
6510
【概率论与数理统计(研究生课程)】知识点总结3(二维随机变量及其分布)
版本:1.0.2 最近更新时间:2022年11月09日 16:32 修改次数:1 历史修改内容: 1.0.2 修改离散型条件概率密度公式 1.0.1 修改联合分布函数的性质公式
Marigold
2023/08/23
4040
matlab习题 —— 符号运算相关练习
一、题目 1. 计算下列极限 (1) \lim\limits_{x \to 0}\frac{\sqrt{1+x}-\sqrt{1-x}}{\sqrt[3]{1+x}-\sqrt[3]{1-x}} (2) \lim\limits_{x \to 0}(\frac{3x+2}{3x-1})^{2x-1} (3) \lim\limits_{x \to 0}(\frac{1}{x^2}-\frac{1}{\sin^2x}) (4) \lim\limits_{x \to 0}(\frac{\pi}{2}-
繁依Fanyi
2023/05/07
4820
matlab习题 —— 符号运算相关练习
竞赛好题暑假练习12
一道数列极限的证明题(利用放缩加构造以及单调有界) 设 f_{0}(x) , f_{1}(x) 是 [0,1] 上的正值连续函数,满足 \displaystyle \int_{0}^{1}f_{0}(x)dx \leq \int_{0}^{1}f_{1}(x)dx ,设 \displaystyle f_{n+1}(x)=\frac{2f_{n}^{2}(x)}{f_{n}(x)+f_{n+1}(x)},n=1,2,3,\dotsb 证明:序列 \displaystyle a_{n}=\int_{0}^{
用户9628320
2022/11/23
2310
【概率论与数理统计(研究生课程)】知识点总结5(大数定律和中心极限定理)
$$ \begin{aligned} \lim_{n\rightarrow\infty}P{|\frac{1}{n}\sum\limits_{k=1}^{\infty}X_k-a_n|\ge\epsilon }=0 \ \lim_{n\rightarrow\infty}P{|\frac{1}{n}\sum\limits_{k=1}^{\infty}X_k-a_n|<\epsilon }=1 \end{aligned} $$
Marigold
2023/08/23
4390
支持向量机原理(四)SMO算法原理
  在SVM的前三篇里,我们优化的目标函数最终都是一个关于$\alpha$向量的函数。而怎么极小化这个函数,求出对应的$\alpha$向量,进而求出分离超平面我们没有讲。本篇就对优化这个关于$\alpha$向量的函数的SMO算法做一个总结。
刘建平Pinard
2018/08/14
6220
支持向量机原理(四)SMO算法原理
Latex数学公式符号编写大全
LaTeX是一种标记语言,主要用于创建高质量的学术文档,特别是数学、物理和计算机科学领域的文档。它基于TeX排版系统,由美国数学家Donald E. Knuth开发。在LaTeX中,你可以轻松地编写复杂的数学公式,并控制文档的布局和样式。
皮大大
2023/08/29
2.2K0
【概率论与数理统计(研究生课程)】知识点总结11(多元统计分析基本概念)
设X=(X_1, X_2,\cdots,X_p)^\top有p个分量,若E(X_i)=\mu_i(i=1,2,\cdots,p)存在,定义随机向量X的均值为: 式中,\vec{\mu}为一个p
Marigold
2023/08/23
3910
【概率论与数理统计(研究生课程)】知识点总结6(抽样分布)
样本均值:\bar{X}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i
Marigold
2023/08/23
3310
数据科学基础(四) 大数定律与中心极限定理
📚 文档目录 随机事件及其概率 随机变量及其分布 期望和方差 大数定律与中心极限定理 数理统计的基本概念 参数估计 假设检验 多维 回归分析和方差分析 降维 4.1 大数定律 大量重复实验的平均结果的稳定性. 4.1.1. 马尔可夫不等式 P\left\{X\geq a\right\}\leq\displaystyle\frac{EX}{a} 证明:EX=\displaystyle\int_0^{\infty}xf(x)dx=\int_a^{\infty}xf(x)dx+\int_0^{a}xf(x)dx
Rikka
2022/01/19
7370
数据科学基础(四) 大数定律与中心极限定理
武忠祥老师每日一题|第240 - 255题
题目240 若 \lim\limits_{x\to0}\bigg(\dfrac{\ln(x+\sqrt{x^2+1})+ax^2+bx^3}{x}\bigg)^{\dfrac{1}{x^2}}=e^2 ,求 a,b 的值 解答 [ \begin{aligned} & \lim\limits_{x\to0}\bigg(\dfrac{\ln(x+\sqrt{x^2+1})+ax^2+bx^3}{x}\bigg)^{\dfrac{1}{x^2}} \\\\ =& \lim\limits_{x\to0}e^{\d
一只野生彩色铅笔
2022/09/20
6980
【组合数学】生成函数 ( 性质总结 | 重要的生成函数 ) ★
文章目录 一、生成函数性质总结 二、生成函数与序列的对应 参考博客 : 【组合数学】生成函数 简要介绍 ( 生成函数定义 | 牛顿二项式系数 | 常用的生成函数 | 与常数相关 | 与二项式系数相关 | 与多项式系数相关 ) 【组合数学】生成函数 ( 线性性质 | 乘积性质 ) 【组合数学】生成函数 ( 移位性质 ) 【组合数学】生成函数 ( 求和性质 ) 【组合数学】生成函数 ( 换元性质 | 求导性质 | 积分性质 ) 一、生成函数性质总结 ---- 1 . 生成函数 线性性质 : 乘法 : b_n
韩曙亮
2023/03/28
1.1K0
武忠祥老师每日一题|第356 - 367题
对于没有 抽象函数 在的极限,我们的手段就很多了,这里既可以 拆项 做,也可以 洛必达
一只野生彩色铅笔
2022/09/20
9100
武忠祥老师每日一题|第288 - 303题
首先排除 罗尔定理,因为题目中没有明确给出相等的两点;而 泰勒中值 一般用于高阶,有些牛刀杀鸡的意思
一只野生彩色铅笔
2022/09/20
7270
竞赛好题暑假练习11
【分析】:本题均是利用定积分以及级数证明的基本功,(1)联想到定积分转化,(2)先裂项后用数学归纳法进行证明。
用户9628320
2022/11/23
3030
推荐阅读
相关推荐
【概率论与数理统计(研究生课程)】知识点总结4(随机变量的数字特征)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文