马尔可夫链是满足马尔可夫性质的随机过程,本文记录相关内容。
马尔可夫链 X_{1}, X_{2}, \cdots 描述了一个状态序列,其中每个状态值取决于前一个状态。 X_{t} 为随机变量, 称为时刻 t 的状态, 其取值范围称作状态空间。
社会学家把人按照经济状况分成三类:下层、中层、上层。用状态 1,2,3
代表着三个阶层。社会学家发现:决定一个人的收入阶层的最重要因素就是其父母的收入阶层。
使用矩阵的表示方式,转移概率矩阵记作:
假设当前这一代人在下层、中层、上层的人的比例是概率分布 \vec{\pi}_{0}=\left(\pi_{0}(1), \pi_{0}(2), \pi_{0}(3)\right) ,则:
假设初始概率分布为 \pi_{0}=(0.72,0.19,0.09) ,给出前 14 代人的分布状况:
编号 | 阶层1 | 阶层2 | 阶层3 |
---|---|---|---|
0 | 0.72 | 0.19 | 0.09 |
1 | 0.5073 | 0.3613 | 0.1314 |
2 | 0.399708 | 0.431419 | 0.168873 |
3 | 0.344788 | 0.461763 | 0.193449 |
4 | 0.31659 | 0.475564 | 0.207846 |
5 | 0.30206 | 0.482097 | 0.215843 |
6 | 0.294555 | 0.485285 | 0.22016 |
7 | 0.290673 | 0.486874 | 0.222453 |
8 | 0.288663 | 0.487677 | 0.22366 |
9 | 0.287622 | 0.488087 | 0.224292 |
10 | 0.287082 | 0.488297 | 0.224621 |
11 | 0.286802 | 0.488406 | 0.224792 |
12 | 0.286657 | 0.488462 | 0.224881 |
13 | 0.286582 | 0.48849 | 0.224927 |
14 | 0.286543 | 0.488505 | 0.224951 |
可以看到从第 9 代开始,阶层分布就趋向于稳定不变。
如果换一个初始概率分布为 \vec{\pi}_{0}=(0.51,0.34,0.15) ,给出前 14 代人的分布状况:
编号 | 阶层1 | 阶层2 | 阶层3 |
---|---|---|---|
0 | 0.51 | 0.34 | 0.15 |
1 | 0.4005 | 0.4246 | 0.1749 |
2 | 0.345003 | 0.459586 | 0.195411 |
3 | 0.316639 | 0.474871 | 0.208489 |
4 | 0.302065 | 0.481879 | 0.216056 |
5 | 0.294551 | 0.485217 | 0.220232 |
6 | 0.290668 | 0.486853 | 0.222478 |
7 | 0.28866 | 0.487671 | 0.223669 |
8 | 0.28762 | 0.488085 | 0.224295 |
9 | 0.287081 | 0.488297 | 0.224622 |
10 | 0.286802 | 0.488406 | 0.224793 |
11 | 0.286657 | 0.488462 | 0.224881 |
12 | 0.286582 | 0.488491 | 0.224927 |
13 | 0.286543 | 0.488505 | 0.224951 |
14 | 0.286523 | 0.488513 | 0.224964 |
可以发现到第 8 代又收敛了。
两次不同的初始概率分布,最终都收敛到概率分布 \vec{\pi}=(0.286,0.489,0.225) 。 这说明收敛的行为和初始概率分布{\vec{\pi}}_0无关,而是由概率转移矩阵P决定的。
如果一个非周期马尔可夫链具有转移概率矩阵P ,且它的任何两个状态是联通的,则有:
其中:
在马尔可夫链定理中:
从初始概率分布 \vec{\pi}_{0} 出发, 在马尔可夫链上做状态转移, 记时刻 i 的状态 X_{i} 服从的概率分布为 \vec{\pi}_{i} , 记作 X_{i} \sim \vec{\pi}_{i} , 则有:
假设到达第n步时,马尔可夫链收敛,则有:
所以 X_{n}, X_{n+1}, X_{n+2}, \cdots 是同分布的随机变量(当然它们并不独立)。
如果从一个具体的初始状态x_0开始,然后沿着马尔可夫链按照概率转移矩阵做调整,则得到一个转移序列
根据马尔可夫链的收敛行为,当n较大时, x_{n}, x_{n+1}, \cdots 将是平稳分布\vec{\pi}的样本。
满足:
则 \vec{\pi} 是马尔可夫链的平稳分布,这也是马尔可夫细致平稳条件。
这被称作马尔可夫链的细致平稳条件 detailed balance condition
已知 \pi(i) P_{i, j}=\pi(j) P_{j, i} ,往证 \vec \pi {\bf{P}} = \vec \pi