前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈

读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈

作者头像
绿巨人
发布2018-05-18 14:07:31
2.1K0
发布2018-05-18 14:07:31
举报
文章被收录于专栏:绿巨人专栏

读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈

多阶段博弈(Multistage Games)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

多阶段博弈

  • 多阶段博弈 多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。 这些阶段博弈的玩家都相同。每个博弈都属于一段截然不同的时期(distinct period)。
  • 多阶段博弈:收益 - 折扣累计和收益(discounted sum payoff) v_i = v_i^1 + \delta^1 v_i^2 + \delta^2 v_i^3 + \cdots + \delta^{T-1} v_i^T = \sum_{t=1}^T \delta^{t-1} v_i^t \\ where \\ \delta \text{: discount rate}
  • 多阶段博弈:策略 “如果在博弈1,博弈2,。。。博弈t-1中发生了这些,我会在博弈 t 中采取行动a。”
  • 多阶段博弈:条件纯策略队列(conditional pure strategies list) 第t个阶段的策略(的参数)是之前的发生的事件。 S_i = {s_i^1, s_i^2(h_1), \cdots, s_i^t(h_{t-1}), \cdots, s_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ s_i^t(h_{t-1}) \text { : an action for player i from the } t \text {th stage-game.} \\ h_{t-1} = ((a_1^1, \cdots, a_n^1), \cdots, (a_1^{t-1}, \cdots, a_n^{t-1}))
  • 多阶段博弈:混合策略(mixed strategy) \sigma_i = {\sigma_i^1, \sigma_i^2(h_1), \cdots, \sigma_i^t(h_{t-1}), \cdots, \sigma_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ \sigma_i^t(h_{t-1}) \text { : an randomization over player i's actions from the } t \text {th stage-game.} \\

推论9.1

在一个T阶段的多阶段博弈中,\sigma^{t*}是第t个阶段的一个纳什均衡。 则在这个多阶段博弈中存在一个子博弈精炼均衡,其均衡路径一致于\sigma^{1*}, \sigma^{2*}, \cdots, \sigma^{T*}产生的路径。

推论9.2

在一个由阶段博弈G_1, G_2, \cdots, G_T T组成的多阶段博弈中,\sigma^*是一个纳什均衡, 则在期间T(最后一个)的阶段博弈中,\(\sigma^*\)的约束一定是这个阶段博弈的纳什均衡。

最后一个博弈不存在依赖性。 后面的博弈如果有多个纳什均衡,则可能会影响前面阶段的博弈结果。(胡萝卜大棒理论)

推论9.3

在一个由有限个阶段博弈组成的多阶段博弈中,每个阶段博弈都有一个唯一的纳什均衡, 则这个多阶段博弈有一个唯一的子博弈精炼均衡。

单阶段偏差原理(The One-Stage Deviation Principle)

单阶段偏差原理用来简化有多个阶段博弈的计算过程。

  • 单阶段不可改善的策略(one-stage un-improvable strategy) 一个策略是单阶段不可改善的,如果不存在h_i, a \in A_i(h_i) v_i(\sigma_i^{a,h_i}, h_i) > v_i(\sigma_i, h_i) \\ where \\ \sigma_i^{a,h_i} \text{: is identical to } \sigma_i \text{ everywhere except at } h_i.

定理:9.1

一个单阶段不可改善的策略一定是最优的。

参照

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-01-04 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
    • 多阶段博弈(Multistage Games)
      • 多阶段博弈
        • 单阶段偏差原理(The One-Stage Deviation Principle)
          • 参照
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档