前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略

读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略

作者头像
绿巨人
发布2018-05-18 13:33:59
1.6K0
发布2018-05-18 13:33:59
举报
文章被收录于专栏:绿巨人专栏

读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略

混合的策略

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

策略,信念和期望收益

  • 混合策略 玩家i的有限纯策略集合S_i = {s_{i1}, s_{i2}, \cdots, s_{im}}\Delta S_i定义为S_i的单纯形,是在S_i上所有概率分布的集合。 玩家i的一个混合策略(mixed strategy)是\sigma_i \in \Delta S_i \sigma_i = (\sigma_i(s_{i1}), \sigma_i(s_{i2}), \cdots, \sigma_i(s_{im})) \\ where \\ \sigma_i(s_{i}) \text{ : the probability that player i plays s_{i}}

两个明显的条件: \sigma_i(s_{i}) \geq 0, \forall s_i \in S_i \\ \sum_{s_i \in S_i} \sigma_i(s_{i}) = 1

v_i(s_i, \sigma_{-i}) = \sum_{s_{-i} \in S_{-i}} \sigma_{-i}(s_{-i}) v_i(s_i, s_{-i}) 玩家i选择混合策略\sigma_i \in \Delta S_i,并且对手选择混合策略\sigma_{-i} \ \Delta_{-i},的期望收益: v_i(\sigma_i, \sigma_{-i}) = \sum_{s_{i} \in S_{i}} \sigma_{i}(s_{i}) v_i(s_i, s_{-i}) = \sum_{s_i \in S_i} ( \sum_{s_{-i} \in S_{-i}} \sigma_{i}(s_{i}) \sigma_{-i}(s_{i-}) v_i(s_i, s_{-i}) )

  • 混合策略的纳什均衡 混合策略组合\sigma^* = (\sigma_1^*, \sigma_2^*, \cdots, \sigma_n^*)是一个纳什策略,如果对于每个玩家\(\sigma_i^*\)都是最佳响应。 v_i(\sigma_i^*, \sigma_{-i}^*) \geq v_i(\sigma_i, \sigma_{-i}^*), \ \forall \sigma_i \in \Delta S_i

推论 6.1

如果\sigma^*是一个纳什博弈,并且\sigma^*支持s_is'_i,则 v_i(s_i, \sigma_{-i}^*) = v_i(s'_i, \sigma_{-i}^*) = v_i(\sigma^*, \sigma_{-i}^*)

Rock-Paper-Scissor

断言 6.1:

如果一个玩家选择纯策略,另一个玩家选择混合策略,则不存在纳什均衡。

断言 6.2:

如果至少有一个玩家选择只有两个纯策略的混合策略,则不存在纳什均衡。

严格劣势策略的迭代消除和可合理化(IESDS and Rationalizability)

  • 严格劣势 s'_i \in S_i严格劣势于\sigma_i \in \Delta S_i,如果满足条件: v_i(\sigma_i, s_{-i}) > v_i(s'_i, s_{-i}), \ \forall s_{-i} \in S_{-i} \\
  • 不可能是一个最佳响应 对于玩家i的混合策略\sigma_i \in \Delta S_i,这个混合策略作为最佳响应的对手混合策略\sigma_i \in BR_i(\sigma_{-1}),如果对手的任何混合策略\sigma_{-1} \in \Delta S_{-i}都不在玩家i的信念中,则\sigma_i \in \Delta S_i不可能是一个最佳响应。

断言

一个劣势混合策略sigma_i不可能是一个最佳响应。

推论 6.2

任何两人博弈中,策略sigma_i是一个严格劣势纯策略,当且仅当策略sigma_i不可能是一个最佳响应。

纳什存在定理

纳什存在定理(Nash's existence Theorem)

任何普通形式、具有限策略集合的博弈存在一个纳什均衡的混合策略。 纳什存在定理的证明用到了不动点定理。

布劳威尔不动点定理(Brouwer's Fixed-Point Theorem)

如果f(x)是一个连续函数从域[0, 1]到[0, 1]f:[0, 1] \to [0, 1],则存在至少一个点f(x^*) = x^*, x^* \in [0, 1] 证明过程简介:连续函数f(x)一定和函数f_1(x) = x至少有一个交点。

  • 最佳响应对应(collection of best response correspondence) 最佳响应对应集合BR \equiv BR_1 \times BR_2 \times \cdots \times BR_n,映射\Delta S \equiv \Delta S_1 \times \Delta S_2 \times \cdots \times \Delta S_n 到自身。 也就是说:BR : \Delta S \rightrightarrows \Delta S, BR(\sigma) \subset \Delta S, \ for \ \sigma \in \Delta S

角谷不动点定理(Kakutani Fixed-Point Theorem)

一个对应C: X \rightrightarrows X有一个不动点,如果以下四个条件都满足:

  1. X是非空的,紧凑的,\mathbb{R}^n的凸子集
  2. C(x)对于所有的x都非空。
  3. C(x)对于所有的x都是凸的。
  4. C有一个闭合图。
  • 凸的(convex) 集合X \subseteq \mathbb{R}^n是凸的,如果集合X中任何两点的连线上的点都在集合X中。
  • 闭合的(closed) 集合X \subseteq \mathbb{R}^n是闭合的,如果集合X边缘点在集合X中。(0, 1]是非闭合的,[0, 1]是闭合的。
  • 紧凑的(compact) 集合X \subseteq \mathbb{R}^n是紧凑的,如果集合X是闭合并且有界。[0, 1]是紧凑的,[0, \infty]是非紧凑的。
  • 闭合图(closed graph) 图C: X \rightrightarrows X是闭合图, 如果C是闭合的。

参照

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-12-26 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
    • 混合的策略
      • 策略,信念和期望收益
        • Rock-Paper-Scissor
      • 严格劣势策略的迭代消除和可合理化(IESDS and Rationalizability)
        • 纳什存在定理
          • 参照
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档