读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性

读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性

在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

子博弈精炼(subgame perfection)

序贯理性就是要求玩家总是选择最佳反应。 子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。

  • 在均衡路径上(on the equilibrium path), 不在均衡路径上(off the equilibrium path) \sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)是一个不完整信息博弈的贝叶斯纳什均衡。 我们说一个信息集在均衡路径上(on the equilibrium path),如果给定的\sigma^*\和类型分布,这个信息集有正可能性到达。 我们说一个信息集不在均衡路径上(off the equilibrium path),如果给定的\sigma^*和类型分布,这个信息集被到达的可能性为0。
  • 信念体系 一个信念体系\mu,在一个扩展形式博弈中,给每个信息集的每个决策点(decision node)都分配了一个概率。 \mu(x) \in [0, 1] \\ \sum_{x \in h} \mu(x) = 1, \forall h \in H
  • 贝叶斯规则(Bayes' Rule) \Pr \{A|B \} = \frac{\Pr \{A \land B \} }{\Pr \{A \land B \} + \Pr \{\lnot A \land B \}}

精炼贝叶斯均衡(perfect Bayesian equilibrium)的四个需求:

  • 需求 15.1 每个玩家在每个信息集上,都将有一个意义明确的信念(关于他的位置)。也就是说博弈将有一个信念体系。
  • 需求 15.2 \sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)是一个不完整信息博弈的贝叶斯纳什均衡,我们要求在所有信息集上,在均衡路径上的信念符合贝叶斯规则。
  • 需求 15.3 对于不在均衡路径上的信息集,其信念值可以是任何值。
  • 需求 15.4 给定玩家的信念,玩家的策略必须是序贯理性。也就是说在每一个信息集上,玩家将选择信念对应的最佳反应。
  • 精炼贝叶斯均衡(perfect Bayesian equilibrium) 如果满足需求15.1 ~ 15.4, 一个贝叶斯纳什均衡\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)和一个信念体系\mu^*构成一个精炼贝叶斯均衡。

精炼贝叶斯均衡也是贝叶斯纳什均衡和子博弈精炼均衡。

推论 15.1 一个(可能是混合的)策略组合\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)是一个贝叶斯博弈\Gamma的贝叶斯纳什均衡, 如果策略组合\sigma^*能使所有的信息集都有具有可能性到达, 则策略组合\sigma^*和(从这个策略组合\sigma^*和类型的概率分布获得的)信仰系统\mu^*一起, 就构成了一个精炼贝叶斯均衡(perfect Bayesian equilibrium)。

序贯均衡(Sequential Equilibrium)

  • 一致的策略组合和信念体系 一个策略组合\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)和一个信念体系\mu^*是一致的, 如果存在一系列的非退化的混合策略组合\{ \sigma^k \}_{k=1}^{\infty}和一系列(根据贝叶斯规则获得的)信任\{ \mu^k \}_{k=1}^{\infty}, 有\lim_{k \to \infty} (\sigma^k, \mu^k) = (\sigma^*, \mu^*)

解释:

这里的意思是:策略组合和信念体系可以互相迭代求解(也可以理解为一个序贯均衡的求解方式) 策略应该简单地最大化每个信息集的预期收益。 那些在策略中得到正概率的信息集合的合理信念,应该是信息集合节点上的条件概率分布(根据贝叶斯规则)。

  • 序贯均衡(Sequential Equilibrium) 一个策略组合\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)和一个信念体系\mu^*是一个序贯均衡, 如果(\sigma^*, \mu^*)是一个一致的精炼贝叶斯均衡。

解释:

序贯均衡是一个精炼贝叶斯均衡。 而一个精炼贝叶斯均衡的策略组合和信念体系是一致的(根据一致性推导所得),这个精炼贝叶斯均衡才是一个序贯均衡。

序贯均衡由于难以应用,较少被使用。

参照

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

python根据BM25实现文本检索

目的 给定一个或多个搜索词,如“高血压 患者”,从已有的若干篇文本中找出最相关的(n篇)文本。 理论知识 文本检索(text retrieve)的常用策略是:用...

99950
来自专栏鹅厂优文

游戏人工智能 读书笔记 (五) AI算法简介——树搜索

本书英文版: Artificial Intelligence and Games - A Springer Textbook

26850
来自专栏机器之心

入门 | 玩转词向量:用fastText预训练向量做个智能小程序

76990
来自专栏Python疯子

Python强大的pyecharts绘画优美图形<三>

支持保存做种格式 对象.render(path='snapshot.html') 对象.render(path='snapshot.png') 对象.re...

36130
来自专栏杨建荣的学习笔记

字符画,你可能未知的美 (76天)

在平时的工作中,如果接触字符界面时间比较长的时候,都会无意识的感觉到单调,认为字符只能表达一些抽象复杂的东西,对于图形的那种简单和清晰,显得有些力不从心。 今天...

31950
来自专栏ATYUN订阅号

赫尔辛基大学AI基础教程:搜索和解决问题(2.1节)

想象一下你在一个外国的城市,在某个地方(比如一家酒店),想用公共交通工具去另一个地方(比如一家不错的餐馆)。你是做什么?如果你会像许多人一样,掏出智能手机,输入...

15560
来自专栏人工智能头条

饿了么推荐系统:从0到1

32350
来自专栏机器学习AI算法工程

使用fasttext实现文本处理及文本预测

因为参加datafountain和CCF联合举办的大数据竞赛,第一次接触到文本预测。对比了一些模型,最终还是决定试一下fasttext。上手fasttext的...

4.9K60
来自专栏程序人生 阅读快乐

[C++数值算法]

本书选材内容丰富,除了通常数值方法课程的内容外,还包含当代科学计算大量用到的专题,如求特殊函数值、随机数、排序、最优化、快速傅里叶变换、谱分析、小波变换、统计描...

10210
来自专栏数说工作室

哈希函数的套路 | 文本分析:大规模文本处理(1)

这个系列打算以文本相似度为切入点,逐步介绍一些文本分析的干货。 第一篇中,介绍了文本相似度是干什么的; 第二篇,介绍了如何量化两个文本,如何计算余弦相似度,穿...

50780

扫码关注云+社区

领取腾讯云代金券