前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >马尔可夫链

马尔可夫链

作者头像
为为为什么
发布2022-08-05 15:49:51
9240
发布2022-08-05 15:49:51
举报
文章被收录于专栏:又见苍岚又见苍岚

马尔可夫链是满足马尔可夫性质的随机过程,本文记录相关内容。

简介

马尔可夫链 X_{1}, X_{2}, \cdots 描述了一个状态序列,其中每个状态值取决于前一个状态。 X_{t} 为随机变量, 称为时刻 t 的状态, 其取值范围称作状态空间。

  • 马尔可夫链的数学定义为:
P\left(X_{t+1} \mid X_{t}, X_{t-1}, \cdots, X_{1}\right)=P\left(X_{t+1} \mid X_{t}\right)

马尔可夫链示例

设定

社会学家把人按照经济状况分成三类:下层、中层、上层。用状态 1,2,3 代表着三个阶层。社会学家发现:决定一个人的收入阶层的最重要因素就是其父母的收入阶层。

  • 如果一个人的收入属于下层,则他的孩子属于下层的概率是 0.65,属于中层的概率是 0.28,属于上层的概率是 0.07 。
  • 如果一个人的收入属于中层,则他的孩子属于下层的概率是 0.15,属于中层的概率是 0.67,属于上层的概率是 0.18 。
  • 如果一个人的收入属于上层,则他的孩子属于下层的概率是 0.12,属于中层的概率是 0.36,属于上层的概率是 0.52 。 从父代到子代,收入阶层的变化的转移概率如下: 子代阶层1 子代阶层2 子代阶层3 父代阶层1 0.65 0.28 0.07 父代阶层2 0.15 0.67 0.18 父代阶层3 0.12 0.36 0.52
转移方式

使用矩阵的表示方式,转移概率矩阵记作:

假设当前这一代人在下层、中层、上层的人的比例是概率分布 \vec{\pi}_{0}=\left(\pi_{0}(1), \pi_{0}(2), \pi_{0}(3)\right) ,则:

  • 他们的子女在下层、中层、上层的人的概率分布是 \vec{\pi}_{1}=\left(\pi_{1}(1), \pi_{1}(2), \pi_{1}(3)\right)=\vec{\pi}_{0} \mathbf{P}
  • 他们的孙子代的分布比例将是 \vec{\pi}_{2}=\left(\pi_{2}(1), \pi_{2}(2), \pi_{2}(3)\right)=\vec{\pi}_{1} \mathbf{P}=\vec{\pi}_{0} \mathbf{P}^{2}
  • ……
  • n 代子孙在下层、中层、上层的人的比例是 \vec{\pi}_{n}=\left(\pi_{n}(1), \pi_{n}(2), \pi_{n}(3)\right)=\vec{\pi}_{n-1} \mathbf{P}=\vec{\pi}_{0} \mathbf{P}^{n}
数据举例
数据1

假设初始概率分布为 \pi_{0}=(0.72,0.19,0.09) ​ ,给出前 14 代人的分布状况:

编号

阶层1

阶层2

阶层3

0

0.72

0.19

0.09

1

0.5073

0.3613

0.1314

2

0.399708

0.431419

0.168873

3

0.344788

0.461763

0.193449

4

0.31659

0.475564

0.207846

5

0.30206

0.482097

0.215843

6

0.294555

0.485285

0.22016

7

0.290673

0.486874

0.222453

8

0.288663

0.487677

0.22366

9

0.287622

0.488087

0.224292

10

0.287082

0.488297

0.224621

11

0.286802

0.488406

0.224792

12

0.286657

0.488462

0.224881

13

0.286582

0.48849

0.224927

14

0.286543

0.488505

0.224951

可以看到从第 9 代开始,阶层分布就趋向于稳定不变。

数据2

如果换一个初始概率分布为 \vec{\pi}_{0}=(0.51,0.34,0.15) ​ ,给出前 14 代人的分布状况:

编号

阶层1

阶层2

阶层3

0

0.51

0.34

0.15

1

0.4005

0.4246

0.1749

2

0.345003

0.459586

0.195411

3

0.316639

0.474871

0.208489

4

0.302065

0.481879

0.216056

5

0.294551

0.485217

0.220232

6

0.290668

0.486853

0.222478

7

0.28866

0.487671

0.223669

8

0.28762

0.488085

0.224295

9

0.287081

0.488297

0.224622

10

0.286802

0.488406

0.224793

11

0.286657

0.488462

0.224881

12

0.286582

0.488491

0.224927

13

0.286543

0.488505

0.224951

14

0.286523

0.488513

0.224964

可以发现到第 8 代又收敛了。

收敛原因

两次不同的初始概率分布,最终都收敛到概率分布 \vec{\pi}=(0.286,0.489,0.225) 。 这说明收敛的行为和初始概率分布{\vec{\pi}}_0无关,而是由概率转移矩阵P决定的。

平稳分布

马尔可夫链定理

如果一个非周期马尔可夫链具有转移概率矩阵P​ ,且它的任何两个状态是联通的,则有:

其中:

  • 1,2, \cdots, j, \cdots ​ 为所有可能的状态。
  • P_{i,j}是转移概率矩阵P的第i行第j列的元素,表示状态i转移到状态j的概率。
  • 概率分布 \vec{\pi} 是方程 \vec{\pi} \mathbf{P}=\vec{\pi} 的唯一解,其中 \vec{\pi}=(\pi(1), \pi(2), \cdots, \pi(j), \cdots), \sum_{j=0}^{\infty} \pi(j)=\mathbf{1} 。 称概率分布 \vec{\pi} ​ 为马尔可夫链的平稳分布。

在马尔可夫链定理中:

  • 马尔可夫链的状态不要求有限, 可以是无穷多个。
  • 非周期性在实际任务中都是满足的。
  • 两个状态的连通指的是:状态 i ​ 可以通过有限的 n ​ 步转移到达 j ​ (并不要求从状态 i ​ 可以直接一步转移到 状态 j ​ )。 零。
收敛

从初始概率分布 \vec{\pi}_{0} 出发, 在马尔可夫链上做状态转移, 记时刻 i 的状态 X_{i} 服从的概率分布为 \vec{\pi}_{i} , 记作 X_{i} \sim \vec{\pi}_{i} , 则有:

假设到达第n​​步时,马尔可夫链收敛,则有:

所以 X_{n}, X_{n+1}, X_{n+2}, \cdots ​是同分布的随机变量(当然它们并不独立)。

如果从一个具体的初始状态x_0开始,然后沿着马尔可夫链按照概率转移矩阵做调整,则得到一个转移序列

x_{0}, x_{1}, \cdots, x_{n}, x_{q_{b}+1}, \cdots

根据马尔可夫链的收敛行为,当n​​较大时, x_{n}, x_{n+1}, \cdots ​​将是平稳分布\vec{\pi}​​​的样本。

平稳分布
细致平稳条件定理

​ 满足:

\pi(i) P_{i, j}=\pi(j) P_{j, i}

\vec{\pi} 是马尔可夫链的平稳分布,这也是马尔可夫细致平稳条件。

这被称作马尔可夫链的细致平稳条件 detailed balance condition

证明

已知 \pi(i) P_{i, j}=\pi(j) P_{j, i}​​​ ,往证 \vec \pi {\bf{P}} = \vec \pi

  • 我们需要证明对于任意的i​​,有:

  • 利用已知条件:

  • 因此:
\vec \pi {\bf{P}} = \vec \pi

参考资料

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021年8月1日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • 马尔可夫链示例
    • 设定
      • 转移方式
        • 数据举例
          • 数据1
          • 数据2
        • 收敛原因
        • 平稳分布
          • 马尔可夫链定理
            • 收敛
              • 平稳分布
                • 细致平稳条件定理
                • 证明
            • 参考资料
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档