Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

作者头像
绿巨人
发布于 2018-05-18 03:51:20
发布于 2018-05-18 03:51:20
6800
举报
文章被收录于专栏:绿巨人专栏绿巨人专栏

读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

预备知识

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

知识点

  • 静态完全信息博弈(static games of complete information) 第一步:每个玩家同时并且独立的选择一个行动,(每个玩家都不知道别人的选择情况) 第二步:根据所有玩家选择的行动,收益被分布到每个玩家。
  • 完全信息博弈(Games of Complete Information) 一个完全信息博弈要求:下面四部分是博弈中所有玩家的公共知识。
  1. 所有玩家的所有可能的行动
  2. 所有可能的结果
  3. 所有玩家的各种行动组合产生什么样的结果
  4. 每个玩家对结果的倾向
  • 公共知识(common knowledge) 一个公共知识是一个事件E,并且 (1) 每个人都知道, (2) 每个人都知道每个人都知道,像这样无限循环下去。

普通形式博弈

  • 普通形式博弈(normal-form game)有下面三个特征:
  1. 一组玩家
  2. 每个玩家有一套行动
  3. 一套收益函数:每个玩家的行动组合都有一个收益值。
  • 策略(strategy) 打算完成一个特定目标的行动计划。
  • 纯策略(pure strategy) 玩家i的一个纯策略是一个确定性的(意味着没有随机性)行动计划。 S_i用来表示玩家i的所有纯策略。
  • 所有玩家的纯策略组合(a profile of pure strategies) s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n 代表在一个博弈中所有n的玩家的一组选择的纯策略组合。
  • 普通形式博弈(normal-form game)的数学表达
  1. 一个有限的玩家集合, N = {1, 2, \cdots, n}
  2. 每个玩家的纯策略集合的组合, {S_1, S_2, \cdots, S_n}
  3. 一套收益函数, {v_1, v_2, \cdots, v_n},对于每个玩家,每一种所有玩家选择的策略组合,都有一个收益值。 $v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N
  • 普通形式博弈(normal-form game)的数学表达例子:囚徒困境(The Prisoner's Dilemma) Players:N = {1,2} Strategy sets: S_i = {M, F} \ for \ i \in N Payoffs: Let v_i(s_1, s_2) be the payoff to player i if player 1 choose s_1 and player 2 chooses s_2 We can then write payoff are v_1(M, M) = v_2(M, M) = -2 v_1(F, F) = v_2(F, F) = -4 v_1(F, M) = v_2(F, M) = -5 v_1(M, F) = v_2(M, F) = -1 M: mum 沉默; F:fink 告密

2人有限博弈的矩阵表达

  • 例子:囚徒困境(The Prisoner's Dilemma)

Player 2

M

F

Player 1

M

-2, -2

-5, -1

F

-1, -5

-4, -4

方案设想(solution concept)

  • 方案设想(solution concept) 方案设想(solution concept)是一个分析博弈的方法,用于限定出所有可能的合理结果。 一个方案设想将导致一个预言或者处方。
  • 均衡(equilibrium) 任何一种可以产生方案设想预言的策略组合。 也就是可以任何一种导致合理结果的策略组合。

如果用因果关系来说明,均衡是(可以导致合理结果的)因,方案设想是(可以导致合理结果的)分析方法,因果关系的公共知识。 从权衡方面来说:方案设想就是一个权衡。均衡的权衡的结果。

  • 方案设想的假设条件
  1. 玩家是理性的
  2. 玩家是智力的
  3. 公共知识:“玩家是理性的”和“玩家是智力的”是所有玩家的公共知识。
  4. 自我执行:方案设想的均衡必须是自我执行的。(每个玩家都会采用一种均衡结果)
  • 方案设想的评估
  1. 存在性(Existence: How often does it apply?)
  2. 唯一性(Uniqueness: How much does it restrict behavior?)
  3. 不变性(Invariance: How sensitive is it to small changes?)
  • 帕累托优势(pareto dominate) 策略组合s帕累托优势于策略组合s',其前提条件:对于每个玩家,在策略组合s中的收益都大于等于在策略组合s‘中的收益,并且至少有一个玩家,在策略组合s中的收益大于在策略组合s‘中的收益。

v_i(s) \geq v_i(s'), \forall i \in N \\ \ v_i(s) > v_i(s'), \exists i \in N

参照

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-12-20 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
读书笔记: 博弈论导论 - 总结
读书笔记: 博弈论导论 - 总结 总结 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记的总结。 博弈论 博弈论是关于智能理性决策者的协作和冲突的数学模型的研究。 博弈论的目的可以说是研究寻找博弈均衡的方法。 博弈论的直接目标不是找到一个玩家的最佳策略,而是找到所有玩家的最理性策略组合。 我们称最理性策略组合为均衡。 博弈论(也叫逆向博弈论)的另外一个作用是机制设计,根据期望的结果,设计一个博弈体系。 博弈论的分类 这本书中将博弈论的只是分
绿巨人
2018/05/18
2.1K0
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识 完整信息的动态博弈 预备知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 动态博弈(Dynamic Games) 静态博弈是每个玩家同时(并且在不知道其他玩家选择的情况下)做出选择。 动态博弈引进了玩家做出选择的先后次序。 注意:玩家i做出了选择后,玩家j知道玩家i做出了选择,但是不一定知道玩家i做出了什么选择。 扩展形式博弈(The Extensive-Form
绿巨人
2018/05/18
1.3K0
读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈
读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈 重复的博弈(Repeated Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 有限地重复的博弈 有限地重复的博弈(Finitely Repeated Games) 给定一个阶段博弈G,一个有限地重复的博弈被记做G(T, ),其中阶段博弈G被连续进行了T次, 是公共折扣因子。 推论 10.1 如果有限重复博弈的阶段博弈有一个唯一的纳什博弈, 则这个
绿巨人
2018/05/18
1.4K0
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈 多阶段博弈(Multistage Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 多阶段博弈 多阶段博弈 多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。 这些阶段博弈的玩家都相同。每个博弈都属于一段截然不同的时期(distinct period)。 多阶段
绿巨人
2018/05/18
2.2K0
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略 混合的策略 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 策略,信念和期望收益 混合策略 玩家i的有限纯策略集合 将 定义为 的单纯形,是在 上所有概率分布的集合。 玩家i的一个混合策略(mixed strategy)是 两个明显的条件: image.png 玩家i选择混合策略 ,并且对手选择混合策略 ,的期望收益:
绿巨人
2018/05/18
1.6K0
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉 建立信誉(Building a Reputation) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往? 本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作。 让我们回忆一下囚徒困境。 囚徒困境的均衡是双方都告密。 在有限多阶
绿巨人
2018/05/18
8350
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈 贝叶斯博弈(Bayesian Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 不完整信息的静态博弈(Incomplete information static games) 不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集、结果集和收益函数等信息。 对不完整信息博弈的处理方法来自于Harsanyi。
绿巨人
2018/05/18
1.8K0
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡 压制信念:纳什均衡(Pinning Down Beliefs: Nash Equilibrium) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纳什均衡 纳什均衡 一个纯策略组合 是一个纳什均衡,如果对于其中的每个策略, 都是 的最佳响应。 推理 5.1: 一个策略组合 ,如何 满足下面的条件之一: 是一个严格的优势策略均衡 是唯一的IESD
绿巨人
2018/05/18
1.2K0
读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标
读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标 拍卖和竞标(Auctions and Competitive Bidding) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 拍卖的类型 公开拍卖(open auctions) 英式拍卖(The English Auctions) 从一个底价开始喊价,出价高者获得物品。 荷兰式拍卖(The Dutch Auctions) 价格从一个高价开始,慢慢下降,第一个喊“买
绿巨人
2018/05/18
1.3K0
读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计
读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计 机制设计(Mechanism Design) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 机制设计的概念 机制设计的目标是设计一个可以达到期望收益的博弈。 由于这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。 这个理论明显在经济和政治方面有很多用途。 我们假象这样一个例子: 某个政府需要设计一个关于化工厂的环保政
绿巨人
2018/05/18
1.5K0
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识 理性和公共知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纯策略中的优势(dominance) 数学表达: 除了玩家i以外所有玩家的策略集合 : 所有人的所有策略组合。 : 除了玩家 以外,所有人的所有策略组合。 : 所有人的一种策略组合。 : 除了玩家 以外,所有人的一种策略组合。 引进 和 是为了 通过看玩家i以外的
绿巨人
2018/05/18
1.9K0
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判 信息传递和廉价谈判(Information Transmission and Cheap Talk) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。 三个结论: 不存在完全诚实的均
绿巨人
2018/05/18
1.3K0
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈 信号传递博弈(Signaling Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 信号传递博弈的核心在于玩家2如何判断玩家1的类型。 可以想象玩家2是一个面试官,试图挑选一个有经验的Java工程师。而玩家1是被面试者。 玩家1有两种类型:类型1是有三年Java工作经验的,类型2是有三年JavaScript工作经验的。 信号传递博弈的两种类别 混同均衡
绿巨人
2018/05/18
2.8K0
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识 理性和公共知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纯策略中的优势(dominance) 数学表达: 除了玩家i以外所有玩家的策略集合 \[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \time
绿巨人
2018/07/04
6300
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性 在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 子博弈精炼(subgame perfection) 序贯理性就是要求玩家总是选择最佳反应。 子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。 在均衡路径上(on the equilibriu
绿巨人
2018/05/18
1.7K0
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性 可信性和序贯理性(Credibility and Sequential Rationality) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 序贯理性和逆向归纳法(Sequential Rationality and Backward Induction) 序贯理性(Sequential Rationality) 序贯理性是一个原则:在博弈树的每一个信息集上,
绿巨人
2018/05/18
1.8K0
读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议
读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议 战略协议(Strategic Bargaining) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。 一个两人协议博弈的过程: 第一回合 玩家1提出分配(x, 1-x),玩家1得到x,玩家2得到1-x。 如果玩家2表示接受,博弈结束, = x, = 1-x。如果玩家2反对,进入下一轮 第二回合
绿巨人
2018/05/18
8510
读书笔记: 博弈论导论 - 01 - 单人决策问题
读书笔记: 博弈论导论 - 01 - 单人决策问题 前言 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 博弈论语言 这章的一个目的是开发一种用于决策的语言。 决策问题的三要素 行动(action): 玩家可能的选择 结果(outcome): 每个行动的可能后果 倾向(preference): 对所有可能后果,按照从最渴望到最不渴望的排列。 术语 倾向关系(preference relation) 描述了玩家的倾向, 意味着“x至少和y
绿巨人
2018/05/18
6880
读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
读书笔记: 博弈论导论 - 02 - 引入不确定性和时间 前言 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 术语 概率分布函数(probability distribution function) 一个简单投机(lottery)(行动 )在结果 上的概率分布记做 累积分布函数(cumulative distribution function) 一个简单投机(lottery)行动 ,在结果区间 上的累积分布函数:
绿巨人
2018/05/18
1K0
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判 信息传递和廉价谈判(Information Transmission and Cheap Talk) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。 三个结论: 不存在完全诚实的均
绿巨人
2018/07/05
6050
推荐阅读
读书笔记: 博弈论导论 - 总结
2.1K0
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识
1.3K0
读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈
1.4K0
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
2.2K0
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
1.6K0
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉
8350
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈
1.8K0
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡
1.2K0
读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标
1.3K0
读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计
1.5K0
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
1.9K0
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判
1.3K0
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈
2.8K0
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
6300
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性
1.7K0
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
1.8K0
读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议
8510
读书笔记: 博弈论导论 - 01 - 单人决策问题
6880
读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
1K0
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判
6050
相关推荐
读书笔记: 博弈论导论 - 总结
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档