上一篇笔记:随机过程(E)——习题课(马尔科夫链-更新过程)
——————————————————————————————————
大家好!
这是《随机过程》系列习题课的第二部分。这一部分我们会介绍从连续时间马尔科夫链到布朗运动的一些习题。这一部分的难度相对大一些,当然了,我们提供的习题也会稍微少一些。
那么我们开始吧。
Problem 13: 一个商人在
三个地方出差,假设从一个地方到另一个地方服从一个指数分布,并且可以画出这样的转移速率矩阵
,单位是年,且状态沿
方向,从上到下,从左到右。问 (1) 长期来看,计算它停留在不同地方的时间占比。 (2) 长期来看,平均它一年会经历多少次
出差?
这是一个标准的连续时间马尔科夫链的计算题,对应第9节(随机过程(9)——连续时间马尔科夫链的泊松过程描述,爆炸现象,离散马尔科夫链对比)的内容。我们在这里只需要计算平稳分布,可以得到
,这就是它呆在
的时间占比。
对于第二个题,根据正文,要把连续时间马尔科夫链理解成泊松过程的状态转移,
,
和
都是会发生的。注意到
的时间是
(根据Description 3,这里看的就是
对应那一行对角线元素的绝对值,也就是
)。而极限状态下的
的所居住的时间占比也碰巧是
,所以相当于说,平均下来一年从
出发的旅行次数就是
。那么又因为
的概率是
(对应的是矩阵中的第2行第1列),所以次数就是
,这个就是第二题的答案。
第二个题的题型并没有在正文出现过,所以一开始可能摸不着头脑。可以多花一些时间自行体会一下解题思路。
Problem 14: 考虑一个卖电脑的问题,假设顾客到来服从一个速率为
的泊松过程,只要电脑店有电脑,到来的顾客就会购买一台。一开始的时候电脑店里有3台电脑,只要电脑店只剩一台电脑了,就会订购2台,但是到达的时间服从
。问 (1) 对电脑数量进行建模,并且计算出平稳分布。 (2) 电脑店卖出电脑的平均速度是?
这一个题目建模不是特别容易,首先从
到
的变化是容易的,相当于购买了两台电脑,那么因为需要等待,所以这个过程就是一个泊松过程,因此速率为
。但是不容易想到的是,从
到
的变化其实依然是一个速率为
的过程,考虑的依然是指数分布的无记忆性。其它的都不难想了,所以最终可以写出转移速率矩阵
求解
就可以得到最终的平稳分布
。
对于第二个题,注意到,事实上卖出电脑的期望速率就是
(就是指数分布的期望),那么又因为概率为
,所以最终的答案就是
。
Problem 15: 假设有3只青蛙在湖边游玩,如果它们在岸上,则每一只青蛙都会以速率为
的指数分布的概率跳到湖中。反过来,如果它们在湖中,则会以速率为
的指数分布的概率再跳回岸上,设
为时间
时的岸上的青蛙个数,问 (1) 刻画出
对应的转移速率矩阵和平稳分布。 (2) 如果考虑建模成三条独立的两状态马尔可夫链,应该如何求解?
有了前面两个题作为基础,这个题目应该就不难了。但是有一个细节是,如果有多只青蛙在岸上,那么先跳下去需要等待的时间,就是这些青蛙等待时间中的最小值,对应指数分布就是将参数相加(可以看第9节与排队论相关的例子,比如Problem 2)。所以我们有
其中状态
从上到下,从左到右排列。懂了上面那句话,就明白为什么
而不是
了。
这个平稳分布求解不是很困难,因为它是满足细致平衡条件的。因此计算的时候可以构造一连串的式子方便求解。具体来说就是设
是一个未知数,然后我们有
可以解出
。剩下的类似,可以得到最终的平稳分布
对于第二问,其实就是解决这个问题的另一个视角。如果我们只考虑一只青蛙,那么很容易得到转移速率矩阵为
其中状态
从左到右,从上到下排序,并且
表示在岸上,
表示在湖中,那么可以求解出
,这就对应上了每一只青蛙在湖中和在岸上的概率,相关的概念也可以在第9节,与离散马尔科夫链的对比中找到。
既然如此,因为三只青蛙的决策相互独立,所以相当于构造出了一个二项分布
,所以这样的话,在岸上的概率就变成了单纯的一个概率论计算题。比如说如果要求
,那么结果就是
。剩下的几个结果也是类似的计算,这里就不多说了。
Problem 16: 考虑Problem 13的背景,也即他出差的转移速率矩阵为
,并且状态为
从上到下,从左到右排列。假设他刚刚从
离开,问 (1) 它平均会花多长时间会再回到
? (2) 通过计算平稳分布来求解(1)。
这一个题是一个连续时间马尔科夫链中,离出分布和到达时间的问题,对应的是笔记的第A节(随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例)。在这里,到达时间对应的就是离散马尔科夫链中的离出时间。
我们设
,那么我们可以列出这样的方程
这里的
是怎么确定的,如果不熟悉的话就需要回头看一下笔记了。解方程组可以得到
。
有了这个之后,我们再用一次“一步转移”,注意到从
出发,到达
的概率各是
,所以有
当然了,我们可以利用平稳分布来求解,是因为我们在这里也介绍过一个思路,就是利用更新奖赏过程的结论,可以得到
这里的
表示的是离开的速率(把它理解为一个泊松过程)。并且通过求解平稳分布可以知道
,所以最终我们可以得到
。
到这里其实还没完,注意到,这个题目中,他是刚刚离开
的,而这个结果其实是包含了一段他停留在
的时间的。因此可以得到最终的答案是
所以这一个题其实并不是简单的一个求解
的到达时间问题。还是需要一些额外的分析过程的。
Problem 17: 考虑一个打字员的问题。假如说经济系和社科系均有一个打字员,并且他们一天都可以打
封信件。已知经济系一天平均需要
封,而社科系需要
封,所以有可能出现系里需要的信件还没有被打完的可能,这个时候会有排队的现象。假设打信件的速度服从指数分布,问 (1) 每个部门的平均的队伍长度,等待排队的时间和在系统的时间。 (2) 如果两个打字员形成一个单独的部门为这两个系服务,问平均的等待排队的时间。
这一个题是一个典型的排队论的问题。虽然排队论的例子我们正文举了很多,但是它难也确实是真的难……我们看一下怎么建模这个问题。
对于第一题,对于经济系研究,那么就是一个典型的
模型。这个模型的转移概率我们也可以写出来为
这个结论可以参考第9节的Problem 1的内容,也可以参考第8节(随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入)的Problem 3,它们俩是一个题。
那么这样的话,注意到这个转移速率是满足细致平衡条件的(想想为什么?)那么自然的,我们会有
。这样的话,就会有
这里的
是在队列的等待时间,
是在系统的等待时间(这里的区别怎么理解,去看一下排队论部分的第8节)。
是队伍的平均长度。
类似的,对于社科系,我们也可以得到平均等待时间为
,而等待的队列长度为
。
对于第二题,如果把打字员合并在一起,那么相当于变成了一个
问题。这个时候,情况要稍微复杂一点。对应的转移速率矩阵就会变为
那么这样的话,求解平稳分布就有
。
这个时候,对应的队伍长度为
并且可以得到相对应的平均等待时间
。
这一问,我们相当于用了另外一种更加直接的方式来计算
,并且反推
。
这里我们补了两个排队网络的问题。虽然我们没有在正文中对排队网络展开来说,但是排队网络的题目的套路和建模都算比较好理解的,所以我们还是补了两个题目,给大家拓宽一些视野。
Problem 18: 考虑一个排队网络的问题,假如说用户到达
站台的速率为
,站台
服务的速率为
。用户在某站台服务结束之后,有可能会前往其他站台,对应的转移概率为
,其它为0。求解这个排队网络的平稳分布。
这里的站台其实就和理发店中的理发师,或者一般排队论模型中的“服务器”是一个意思。这里
就是从
到
的概率是
,剩下的
的概率
因为排队网络的正文没有展开,这里我们也会说的简略一点。注意到首先,要求解出一个长期的,不同站台的客户到达速率
。这样的话,因为系统稳定的时候,进站台和出站台对应的速率是相同的。所以可以通过解方程,得到
解方程可以得到
。注意到
(
是每一个站台的服务速率),所以平稳分布是存在的。所以可以得到平稳分布
最后的平稳分布,虽然我们没有讲一般情况下的公式,但对比第A节最后排队网络中,两站网络的介绍,相信你也可以对应的看出这里的计算公式究竟是怎么来的。
Problem 19: 考虑一个菜市场卖菜的问题。已知店铺
的顾客到达速率分别为
。每一个菜市场服务的速率足够大,保证整个排队网络存在平稳分布。其中顾客离开某一个店铺之后,可能会前往其它的店铺,对应的转移概率为
,
,
。求解这三个店铺的服务总速率为多少?
这个答案其实是显而易见的,因为顾客到达和离开的速率必须是一致的,所以服务速率自然联想到应该是
。这里我们使用正规的排队网络的求解思路,把这个问题再重新考虑一下,不过也不难。
先求解极限状态下的进入和离开速率
,我们有
求解方程组可以得到
。那么这样的话,结合每一个顾客离开的概率,就可以得到最终的速率
Problem 20: 考虑一个乘积鞅的问题。
,其中
,问
满足什么样的条件,可以使得
是一个鞅。
这个问题就是一个概念题。注意到第B节(随机过程(B)——鞅的引入,性质与举例。可选停时定理)的乘积鞅的部分,我们提过说,必须要求
才可以。但是注意到,因为我们有
,所以对应可以知道,
,所以有
(这也是概率论里的知识了)。所以条件就是
。
Problem 21: 考虑一个“不公平的公平游戏”。设
,并且对
,
。也就是说,如果设
,那么有
。 (1) 证明
是一个鞅。 (2) 证明
(这里的
就是
)。 (3) 利用(2),证明
。
这里实际上还是乘积鞅的一个题目,我们仔细看看。设
,那么我们有
这是因为
。所以第一个题很好证明了。
对于第二个题,其实也是个概率论的大数定律的题目。注意到
这就足够得到结论了。如果
不会计算的话,说明微积分需要加强hh。
最后一个问题的话,注意到
注意到
,而
,所以自然的就有最终的结论成立了。
这一个问题很有意思的地方在于,如果我们认为
是财产的话,那么虽然
是一个鞅,但是最终的趋势却告诉我们
,相当于“游戏的规则公平,却一定会破产”,因此我们叫它“不公平的公平游戏”,也不是没有道理。
另外,关于可选停时定理的问题,我们在正文中其实已经做了很多举例,这里就不多提了。
Problem 22: 考虑一个投资问题。设资本服从一个带偏移的布朗运动,即
,且
。设
,计算
。
这一个问题是一个布朗运动相关的问题,也是一个非常接近金融数学的题目了。我们用这一个问题来结束我们的习题课。
我们在正文的第C节(随机过程(C)——可选停时定理的应用,鞅的不等式与收敛性证明)介绍可选停时定理的应用的时候,其实也有类似的估计这种有限概率的问题。在这里,我们可以利用类似的证明方法,先找到一个鞅,再使用可选停时定理来求解。
这里比较常见的构造是指数鞅,因为指数鞅成立的条件是比较容易达成的。注意到对
,我们有
这里的
也是一个布朗运动,读者可以自己验证。一个好的理解是,这个“偏移“并没有带入任何“随机变量”相关的信息,自然也就不会影响独立性。
如果要求指数鞅,只需要我们的系数
。所以可以得到
,那么根据可选停时定理,可以得到
但另一方面,拆分
的范围,我们可以有
注意到在
的时候,有
(想想为什么?),所以有
这一部分解答完之后,对于另外一个部分,注意到
(这是因为
相比较一次项
来说,可以忽略不计,具体可以参考第D节正文中的Proposition 10),那么自然的会有
,且
的时候,有
。所以根据控制收敛定理(见《实分析》的相关内容(https://zhuanlan.zhihu.com/p/36921064)),我们有
这就得到了最终的结论
。
好的,到此为止,《随机过程》的这一系列,就正式告一段落了。
学弱猹的精品小屋
知乎学弱猹,厦门大学计算数学系16级本科,教育部“拔尖计划”成员,从事互联网数据算法相关工作。乐于数学,编程类知识分享,阅读量300w+