专栏首页绿巨人专栏读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性

读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性

读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性

可信性和序贯理性(Credibility and Sequential Rationality)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

序贯理性和逆向归纳法(Sequential Rationality and Backward Induction)

  • 序贯理性(Sequential Rationality) 序贯理性是一个原则:在博弈树的每一个信息集上,玩家总是使用最佳策略。 这意味着,无论是否在均衡路径上,博弈次序的每个阶段,玩家都是在做理智的选择。
  • 序贯理性(Sequential Rationality) 给定玩家i对手的策略组合\sigma_{-i} \in \Delta S_{-i},玩家策略\sigma_i是序贯理性的, 当且仅当玩家i在每个信息集上,总是选择\sigma_{-i}最佳响应。

方法 - 逆向归纳法解:

从末端节点开始,在上一层的每个节点的收益组合为节点玩家的(子节点的)最佳收益组合。 以此类推,直到根节点。根节点上的收益组合(可能是多个)的博弈路径为逆向归纳法解。

推论8.1 (Zermelo's Theorem)

任何有限完美信息博弈都有一个逆向归纳法解,而且是顺序合理的。 此外,如果没有两个末端节点有(对每个玩家)相同的收益,则逆向归纳法解是唯一的。

推论

任何有限完美信息博弈至少有一个顺序合理的纯策略形式的纳什均衡。 此外,如果没有两个末端节点有(对每个玩家)相同的收益,则有唯一的顺序合理的纳什均衡。

  • 适当的子博弈(proper subgame) 博弈\Gamma的一个适当子博弈G只包含一个节点和它所有子孙节点,并具有性质: 如果s \in G并且x' \in h(x),则x' \in G - 属于子博弈G的节点,这个节点的信息集包含的所有节点都属于这个子博弈G
  • 子博弈精炼均衡(subgame-perfect (Nash) equilibrium) 在一个扩展形式博弈\Gamma中,如果对于每一个子博弈G\sigma^*都是G中的纳什均衡,则行为策略组合\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)是一个子博弈精炼均衡。

事实

对于任何有限完美信息博弈,子博弈精炼纳什均衡的集合和逆向归纳法的纳什均衡的集合是一致的。

参照

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AAAI 2018 | 腾讯AI Lab参与提出EAD:基于弹性网络正则化的深度神经网络对抗样本攻击

    机器之心
  • PyTorch一周年战绩总结:是否比TensorFlow来势凶猛?

    机器之心
  • ICLR 2018 | CMU提出新型智能体定位方法:「主动神经定位器」

    机器之心
  • 教程 | 从零开始:TensorFlow机器学习模型快速部署指南

    机器之心
  • 业界 | 追一科技完成B轮2060万美元融资,创新工场领投

    机器之心
  • 业界 | 从服务内部到实现商业化,美团云所经历的这两年

    机器之心
  • 资源 | NIPS 2017 Spotlight论文Bayesian GAN的TensorFlow实现

    机器之心
  • 机器之心最干的文章:机器学习中的矩阵、向量求导

    机器之心
  • 业界 | 滴滴成立AI Labs:由副总裁叶杰平教授领导

    机器之心
  • 一次搞定多种语言:Facebook展示全新多语言嵌入系统

    机器之心

扫码关注云+社区

领取腾讯云代金券