读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

战略协议(Strategic Bargaining)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。

一个两人协议博弈的过程:

  • 第一回合
  • 玩家1提出分配(x, 1-x),玩家1得到x,玩家2得到1-x。
  • 如果玩家2表示接受,博弈结束,v_1 = x, v_2 = 1-x。如果玩家2反对,进入下一轮
  • 第二回合
  • 剩余变成了1 - \delta。折扣率0 < \delta < 1
  • 玩家2提出分配(x, 1-x),玩家1得到x,玩家2得到1-x。
  • 如果玩家1表示接受,博弈结束,v_1 = \delta x, v_2 = \delta (1-x)。如果玩家1反对,进入下一轮。
  • 第三回合及以后
  • 博弈如上继续,在奇数回合,玩家2的反对则导致其在下一轮变成提议者,反之亦然。
  • 每个回合的继续,到导致剩余的一次折扣,在第t个回合,剩余未 \delta^{t-1}\

协议博弈和之前博弈的不同之处:

  • 如果提议被接受,博弈会在任何回合结束。
  • 收益只有在整个博弈结束时才产生,而不是每个回合就会产生。

只有一轮的协议:最后的话博弈(The ultimatum game)

take it or leave it. 推论:11.1

在一个T=1的协议博弈中,剩余的任何分配都能被支持为一个纳什博弈:x^* \in [0, 1], (v_1, v_2) = (x^*, 1 - x^*) 推论:11.2 在一个T=1的协议博弈中,允许一个唯一的子博弈精炼均衡,在这个均衡中,玩家1提供x=1,并且玩家2接受任何x \leq 1

有限回合的协议博弈

推论:11.3

任何子博弈精炼均衡必定导致玩家们可以在第一回合达成一致。 两人奇数回合的协议博弈的结果 v_1^* = x_1 = \frac{1 + \delta^T}{1 + \delta} \ and \ v_2^* = (1 - x_1) = \frac{\delta - \delta^T}{1 + \delta} \\ \lim_{T \to \infty} v_1^* = \lim_{T \to \infty} \frac{1 + \delta^T}{1 + \delta} = \frac{1}{ 1 + \delta} \\ \lim_{T \to \infty} v_2^* = \lim_{T \to \infty} \frac{\delta - \delta^T}{1 + \delta} = \frac{\delta}{1 + \delta} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_1^* = \lim_{\delta \to 1} \frac{1}{1 + \delta} = \frac{1}{2} \\ \lim_{\delta \to 1} \lim_{T \to \infty} v_2^* = \lim_{\delta \to 1} \frac{\delta}{1 + \delta} = \frac{1}{2} \\

说明了

  • 玩家1拥有last-mover take-it-or-leave-it 优势和 first-mover折扣优势,意味着: v_1^* > v_2^*
  • 如果玩家都是有耐性的(也就是说不接受达到自己最低要求的提议),则last-mover take-it-or-leave-it优势消失了。
  • 长期的回合消除了last-mover take-it-or-leave-it优势。
  • \delta = 1消除了first-mover优势。

无限回合的协议博弈

两人无限回合的协议博弈的结果 \overline{v}_1 = \overline{v}_2 = \overline{v} \\ \underline{v}_1 = \underline{v}_2 = \underline{v} \\ \underline{v} = 1 - \delta \overline{v} \\ \overline{v} = 1 - \delta \underline{v} \\ \underline{v} = \overline{v} = \frac{1}{1 + \delta} \\ where \\ \overline{v} \text{ : the best subgame-perfect equilibrium} \\ \underline{v} \text{ : the worst subgame-perfect equilibrium} \\

协议立法

封闭规则协议(Closed-Rule Bargaining)

博弈规则:

有N奇数个玩家,需要\(\frac{N+1}{2}\)个接受才能是提议通过。 在每个周期里,每个玩家都有相同的可能性称为提议者。 博弈结果: where \\ k \text{ : the proposer's best response} \\ v \text{ : the expected payoff for any player i}

提议者的最佳收益:需要得到n-1的人的同意,由于折扣优势,这个n-1个人的收益为\delta v k = 1 - \frac{N - 1}{2} \delta v \\ 回应者的收益:有\frac{1}{N}可能性成为提议者,拿到k; 有\frac{N - 1}{N}的可能性成为回应者,并且只有\frac{1}{2}的可能性(因为提议者只提供收益给回应者中的一半人)拿到\delta v v = \frac{k}{N} + \frac{N - 1}{2N} \delta v \\

计算结果: v = \frac{1}{N} \\ k(N) = 1 - \delta ( \frac{N - 1}{2N}) \\

说明了

  • 当回扣率增加,提议者的收益变少。
  • 玩家越多,提议者收益越大,回应者收益越少。

开放规则协议(Opened-Rule Bargaining)

博弈规则:

有N奇数个玩家。 提议者提出一个协议, 有一个修订者提出一个修改协议。 如果提议者的协议通过了\frac{N+1}{2}。则被接受。 否则,修改协议变成主协议。 一个新的修订者提出一个修改协议。 再次投票,重复上面的过程。

保证方案(guaranteed success)

无论那个响应者成为修订者,都可通过的方案。 案例:3个玩家。 where \\ k \text{ : the proposer's best response} \\ v(k) \text{ : the expected payoff for any player i}

回应者的收益:一方面为\frac{1 - k}{2},一方面为\delta v(k) \frac{1 - k}{2} = \delta v(k) \\ 修订者的收益:由于对称性,修订者的给自己的收益\(v(k)\)应该是k。 v(k) = k \\

计算结果: k = \frac{1}{1 + 2 \delta} \\

说明了

  • 玩家越有耐心,提议者的付出越多。
  • 封闭规则对提议者有利。

冒险方案(risky success)

冒一个部分响应者不会成为修订者的风险。 where \\ k \text{ : the proposer's value to himself} \\ v(k) \text{ : the expected payoff for proposer} \\ v(0) \text{ : the expected payoff for the player who will be offered 0}

回应者的收益:一方面为1 - k,一方面为\delta v(k) 1 - k = \delta v(k) 提议者的期望收益:有\frac{1}{2}可能性拿到k;如果冒险失败,有\frac{1}{2}可能性拿到v(0)。 v(k) = \frac{1}{2} k + \frac{1}{2} \delta v(0) \\ 得到0的玩家的期望收益:有一半的可能性得到v(k)。 v(0) = \frac{1}{2} \delta v(k) \\

计算结果: k = \frac{4 - \delta^2}{4 + 2 \delta - \delta^2} \\ v(k) = \frac{2}{4 + 2 \delta - \delta^2} \\

说明了

  • \delta > \sqrt{3} - 1时,冒险方案更好。

参照

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java一日一条

如何避免软件工程中最昂贵错误的发生

编者按:影响软件工程进度的原因有很多种,而代码重写无疑是最耗费时间的变更之一。那么重写的时候需要注意哪些细节才能把资源开销控制到最低或可接受的程度呢?本文作者E...

6720
来自专栏阿杜的世界

持续学习杂谈:阅读前言IT行业的知识结构最近的阅读列表阅读经验

最近在阅读Bob大叔的新书——《Clean Architecture》(需要的同学可以在公众号后台回复数字1获取),感觉字字珠玑,值得反复阅读&品味。关于系统设...

43810
来自专栏牛客网

阿里菜鸟网络1-4面总结

作为物理跨专业求职的菜鸟,至今也只面过华为和菜鸟网络,华为那边现在是面试通过,具体offer什么时候发看公司心情。看了这么久的牛客网讨论区,今天和大家分享一下菜...

2K60
来自专栏企鹅号快讯

C加加初学者需要看什么书

计算机基础的话下一步,没有就看《深入理解计算机系统》; ? 分享之前我还是要推荐下我自己的C/C++学习交流裙:三 四 三 八 九 一 三 六 五,不管你是小白...

26790
来自专栏iOSDevLog

时间管理笔记(总结)

387100
来自专栏牛客网

成都银联面经

13240
来自专栏Python小屋

Python+numpy实现蒙特卡罗方法估计圆周率近似值

问题描述:使用蒙特卡罗方法估计圆周率近似值,具体描述详见以前发的文章 蒙特.卡罗方法求解圆周率近似值原理与Python实现

12920
来自专栏点滴积累

编程的思想性——议编程与“武功”的一致性

一、缘起        最近做了一件事情,将写好的scala程序中稍显混乱和不雅的代码进行了重构(系列博客见http://www.cnblogs.com/sho...

35350
来自专栏PHP在线

为什么谷歌要执行严格的代码编写规范

原文出处: Mark CC 译文出处:外刊IT评论 本文是《Google是如何做代码审查的?》的续篇 我们在谷歌所做事情中另外一个让我感到异常有效、有用...

33060
来自专栏北京马哥教育

所有人都说Python 简单易学,为何我觉得难?

记得刚学Python的时候,几乎所有人都说Python 简单易学,而对于编程零基础,只掌握Word和Excel的人来说,感觉真的好难。 学习之前网上的教材看了...

52370

扫码关注云+社区

领取腾讯云代金券