读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

绿巨人

发布于 2018-05-18 14:22:08

1.5K0

文章被收录于专栏：绿巨人专栏绿巨人专栏

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

重复的博弈(Repeated Games)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

有限地重复的博弈

有限地重复的博弈(Finitely Repeated Games) 给定一个阶段博弈G，一个有限地重复的博弈被记做G(T, \delta)，其中阶段博弈G被连续进行了T次，\delta是公共折扣因子。

推论 10.1

如果有限重复博弈的阶段博弈有一个唯一的纳什博弈，则这个有限重复博弈有一个唯一的子博弈精炼均衡。

现值(present value) 在一个无限队列的收益 { v_i }_{i=1}^{\infty}中，玩家i的现值是 v_i = \sum_{t=1}^{\infty} \delta^{t-1} v_i^t \\ where \\ 0 < \delta < 1
平均收益(average payoff) 在一个无限队列的收益 { v_i }_{i=1}^{\infty}中，玩家i的现值是 \bar{v_i} = (1 - \delta) \sum_{t=1}^{\infty} \delta^{t-1} v_i^t \\ where \\ \delta < 1
策略在一个无限重复博弈中，H_t代表长度为t的所有可能历史的集合。 h_t \in H_t是一种历史。 H = \cup_{t=1}^{\infty} H_t为所有可能历史的集合。玩家i的一个纯策略是一个映射s_i: H \to S_i，映射历史到这个阶段博弈的行动。玩家i的一个行为策略一个映射\sigma_i: H \to \Delta S_i，映射历史到这个阶段博弈的行动的随机选择。
子博弈精炼均衡(Sub-game-perfect equilibria) 一个纯博弈组合(s_1^*(\cdot), s_2^*(\cdot), \cdots, s_n^*(\cdot)), s_i: H \to S_i, \forall i \in N是一个子博弈精炼均衡，如果在每一个子博弈中，(s_1^*(\cdot), s_2^*(\cdot), \cdots, s_n^*(\cdot))的约束都是一个纳什均衡。

推论 10.2

一个无限重复博弈G(\delta), \delta < 1，其阶段博弈G的一个（静态）纳什均衡(\sigma_1^*, \sigma_2^*, \cdots, \sigma_n^*) 定义这个重复博弈的每个玩家i的策略为不依赖历史的纳什策略，\sigma_i^*(h) = \sigma_i^*, \forall h \in H 则(\sigma_1^*(h), \sigma_2^*(h), \cdots, \sigma_n^*(h))为这个重复博弈的一个子博弈精炼均衡。

不依赖历史的无限重复博弈中阶段博弈，其纳什均衡就是重复博弈的子博弈精炼均衡。

推论 10.3

在一个无限重复博弈G(\delta)中，一个策略组合是一个子博弈精炼均衡，当且仅当不存在玩家i在其单个历史h_{t-1}中，可以从s_i(h_{t-1})偏离中获得更多的收益。

凸组合(convex combination) 给定两个矢量v = (v_1, v_2, \cdots, v_n)和v’ = (v‘_1, v’_2, \cdots, v‘_n) \hat{v} = (\hat{v}_1, \hat{v}_2, \cdots, \hat{v}_n)是一个凸组合(convex combination)，如果\hat{v} = \alpha v + (1 - \alpha) \hat{v}, \alpha \in [0, 1]或者说\hat{v}_i = \alpha v_i + (1 - \alpha) \hat{v}_i, \forall i \in [1, \cdots, n] 从几何上说凸组合位于两个点之间线段上的任意点。
凸包(convex hull) 给定一组矢量V = \{v^1, v^2, \cdots, v^k \}，则V的凸包(convex hull)为： CoHull(V) = \{ \\ v = \sum_{j=1}^k \alpha_j v^j \\ where \\ v \in \mathbb{R}^n, \\ \exists (\alpha_1, \cdots, \alpha_k) \in R_+^n, \\ \sum_{j=1}^k \alpha_j = 1\\ \}

几何上的理解为：当n = 2（矢量的维度是2）时，两个点的凸包就是两个点之间线段; 多个点的凸包就是多个点之间组成的平面; 当n > 2（矢量的维度 > 2）时，两个点的凸包就是两个点之间线段; 多个点的凸包就是多个点之间组成的多维空间（维度为m \leq n \ \land \ m \leq k - 1）

可行收益(feasible payoffs) 一个博弈的所有收益的凸包为可行收益的集合。

大众定理(the folk theorem)

G(\delta)为一个有限，同时选择的完整信息博弈， v^* = (v_1^*, \cdots, v_n^*)为博弈G的一个纳什均衡的收益，也是G的可行收益。如果存在v_i > v_i^*, \forall i \in N, \delta为一个足够接近1的值，则对于\(G(\delta)\)的无限重复博弈，存在一个子博弈精炼均衡，其平均收益接近于v = (v_1, \cdots, v_n)

大众定理由于是多人贡献，也搞不清是那些人，而得名。

参照

Game Theory An Introduction (by Steven Tadelis)
读书笔记: 博弈论导论 - 01 - 单人决策问题
读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈预备知识
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈理性和公共知识
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈纳什均衡
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈混合的策略
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈预备知识
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈可信性和序贯理性
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈多阶段博弈
读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2018-01-12 ，如有侵权请联系 cloudcommunity@tencent.com 删除

机器学习

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

机器学习

登录后参与评论

0 条评论

热度

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

重复的博弈(Repeated Games)

有限地重复的博弈

参照

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈

重复的博弈(Repeated Games)

有限地重复的博弈

参照

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈重复的博弈