读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈 重复的博弈(Repeated Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 有限地重复的博弈 有限地重复的博弈(Finitely Repeated Games) 给定一个阶段博弈G,一个有限地重复的博弈被记做G(T, ),其中阶段博弈G被连续进行了T次, 是公共折扣因子。 推论 10.1 如果有限重复博弈的阶段博弈有一个唯一的纳什博弈, 则这个
你是,我是 aoho。今天和大家聊聊最近所用到博弈论的相关理论和算法,准备几篇文章来具体介绍下博弈论。
博弈论思想历史久远,比如中国古代的《孙子兵法》。早年的博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上, 没有向理论化发展,正式发展成一门学科则是在20世纪初。
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉 建立信誉(Building a Reputation) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往? 本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作。 让我们回忆一下囚徒困境。 囚徒困境的均衡是双方都告密。 在有限多阶
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈 信号传递博弈(Signaling Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 信号传递博弈的核心在于玩家2如何判断玩家1的类型。 可以想象玩家2是一个面试官,试图挑选一个有经验的Java工程师。而玩家1是被面试者。 玩家1有两种类型:类型1是有三年Java工作经验的,类型2是有三年JavaScript工作经验的。 信号传递博弈的两种类别 混同均衡
读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标 拍卖和竞标(Auctions and Competitive Bidding) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 拍卖的类型 公开拍卖(open auctions) 英式拍卖(The English Auctions) 从一个底价开始喊价,出价高者获得物品。 荷兰式拍卖(The Dutch Auctions) 价格从一个高价开始,慢慢下降,第一个喊“买
读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈 贝叶斯博弈(Bayesian Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 不完整信息的静态博弈(Incomplete information static games) 不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集、结果集和收益函数等信息。 对不完整信息博弈的处理方法来自于Harsanyi。
读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判 信息传递和廉价谈判(Information Transmission and Cheap Talk) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。 三个结论: 不存在完全诚实的均
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性 在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 子博弈精炼(subgame perfection) 序贯理性就是要求玩家总是选择最佳反应。 子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。 在均衡路径上(on the equilibriu
读书笔记: 博弈论导论 - 总结 总结 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记的总结。 博弈论 博弈论是关于智能理性决策者的协作和冲突的数学模型的研究。 博弈论的目的可以说是研究寻找博弈均衡的方法。 博弈论的直接目标不是找到一个玩家的最佳策略,而是找到所有玩家的最理性策略组合。 我们称最理性策略组合为均衡。 博弈论(也叫逆向博弈论)的另外一个作用是机制设计,根据期望的结果,设计一个博弈体系。 博弈论的分类 这本书中将博弈论的只是分
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈 多阶段博弈(Multistage Games) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 多阶段博弈 多阶段博弈 多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。 这些阶段博弈的玩家都相同。每个博弈都属于一段截然不同的时期(distinct period)。 多阶段
我肯定你说对了。对于我们这些早期数学发烧友来说,电影《美丽心灵》(A Beautiful Mind)已经深深地印在了我们的记忆中。Russell Crowe在电影中扮演John Nash,一位诺贝尔经济学奖得主(上图左侧)。
读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计 机制设计(Mechanism Design) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 机制设计的概念 机制设计的目标是设计一个可以达到期望收益的博弈。 由于这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。 这个理论明显在经济和政治方面有很多用途。 我们假象这样一个例子: 某个政府需要设计一个关于化工厂的环保政
「博弈论」这个词可能对于一些仅仅致力于机器学习前沿算法的人并不算熟悉。其实,有意无意的,博弈论的思想一直存在于很多机器学习的探索过程中,不管是经典的 SVM,还是大火的 GAN,这些模型的背后都有博弈论的影子。
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性 可信性和序贯理性(Credibility and Sequential Rationality) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 序贯理性和逆向归纳法(Sequential Rationality and Backward Induction) 序贯理性(Sequential Rationality) 序贯理性是一个原则:在博弈树的每一个信息集上,
读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议 战略协议(Strategic Bargaining) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。 一个两人协议博弈的过程: 第一回合 玩家1提出分配(x, 1-x),玩家1得到x,玩家2得到1-x。 如果玩家2表示接受,博弈结束, = x, = 1-x。如果玩家2反对,进入下一轮 第二回合
princeton_bitcoin_book Mastering Bitcoin request_whitepaper
博弈论(Game Theory) - 01 - 前传之占优战略均衡 开始 我们现在准备攀爬博弈论的几座高峰。 我们先看看在纳什均衡产生之前,博弈论的发展情况。 我们的第一座高峰是占优战略均衡。 囚徒困境(prisoner's dilemma)和占优战略均衡 囚徒困境 经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持抵赖,此人将即时获释,沉默者
读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡 压制信念:纳什均衡(Pinning Down Beliefs: Nash Equilibrium) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纳什均衡 纳什均衡 一个纯策略组合 是一个纳什均衡,如果对于其中的每个策略, 都是 的最佳响应。 推理 5.1: 一个策略组合 ,如何 满足下面的条件之一: 是一个严格的优势策略均衡 是唯一的IESD
在小罗同学的技术支持下,本公众号开设一个博弈论专栏,不定期更新,无限期拖稿。欢迎大家一起来学习有趣的博弈论。
AI 科技评论按:作者Carlos Perez是一名软件开发者,著有《深度学习的设计模型》一书。他在这篇文章中提及了我们熟悉的概念——博弈论,并认为这一概念将会更广泛地应用于机器学习中。 在电影《美丽心灵》中,“如何科学把妹”让我们得以直观地理解约翰·纳什的博弈论,但实际上不完全信息博弈论中的近似纳什均衡也已经出现在一些机器学习的论文中。其中原因何在?雷锋网为读者们编译了他在KDnuggets上的文章,一起来看看吧。 如果你一直是我文章的读者,那么你应该知道,对于许多深度学习的资深从业者来说,新的架构设
人工智能(AI)的研究领域充满了无法回答的问题以及无法被分配给正确问题的答案。在过去,人工智能为它坚持「错误」的做法付出了代价,经历了一段时间的停滞,也就是所谓的「人工智能的寒冬」。然而,人工智能的日历刚刚翻入了春天,相关的应用领域正在蓬勃发展。
论文地址:http://arxiv.org/pdf/2010.07906v1.pdf
比特币的共识问题使用了博弈论的研究,这一点有些人知道有些人不知道。但是博弈论到底给比特币这样新诞生的软件带来了什么,可能很多人都不清楚。博弈论的应用和Proof of Work的实施,无疑是非常天才的一个做法。
为啥要提到这个问题呢,是因为最近一直在做生成对抗网络(GAN)的工作,GAN的灵感来源于博弈论(也叫对策论,竞赛论)中的零和博弈,而原始GAN的优化目标又是一个极小化极大问题,所以我觉得有必要深入了解一下这个问题。另外,我觉得博弈论这个东西挺有意思的,而且挺实用的(坏笑脸),所以就查了一些资料,在这里做个总结,拿出来和大家分享。 博弈的意思其实比较简单,就是两个人,或者多个人之间的竞争,比赛。通过采取不同措施,达到不同的目的,使得自己的利益最大化。古老的故事“田忌赛马”就是博弈思想的体现,我就在想为啥田忌没
博弈论是一门很庞大的学科,它算是数学的一个分支,也和运筹学甚至是经济学有关。虽然它严格说起来并不是算法领域的内容,但是有不少关于博弈论有趣的算法和问题。关于博弈的相关理论从很早就已经有了雏形,但是正式构建理论成为一门学科是从计算机之父冯诺依曼开始的。从这点上来说也和计算机有点关系。
读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识 完整信息的动态博弈 预备知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 动态博弈(Dynamic Games) 静态博弈是每个玩家同时(并且在不知道其他玩家选择的情况下)做出选择。 动态博弈引进了玩家做出选择的先后次序。 注意:玩家i做出了选择后,玩家j知道玩家i做出了选择,但是不一定知道玩家i做出了什么选择。 扩展形式博弈(The Extensive-Form
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略 混合的策略 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 策略,信念和期望收益 混合策略 玩家i的有限纯策略集合 将 定义为 的单纯形,是在 上所有概率分布的集合。 玩家i的一个混合策略(mixed strategy)是 两个明显的条件: image.png 玩家i选择混合策略 ,并且对手选择混合策略 ,的期望收益:
AI 科技评论按:随着 AI 系统在现实生活中变得越来越重要,我们自然该探索不同系统间的交互方式了,这些多智能体间到底用了什么独特的方式呢? 在 DeepMind 的最新论文(发表在 Scientific Reports , Nature 出版社旗下杂志)中,研究人员用了博弈论来阐明这一问题。具体来说,他们研究了两套智能系统在非对称博弈游戏(asymmetric game)中的反应和表现,这些游戏包括 Leduc 扑克和一些图版游戏(如 Scotland Yard)。 在现实生活中,我们会遇到许多类似非对称
大家好,这里是 NewBeeNLP。今天分享 LLM 在博弈论框架下的 战略决策能力 。
博弈论不是权谋学,不能教大家怎样损人利己。而是在假定人性自私的前提下,思考如何制约与引导人们的行为。
AI诞生之初,很长一段时间都停留在个体智能阶段,即面向“识别出图像中的内容”、“听懂一段语音”、“预测蛋白质的3D结构”这类目标单一的任务。
📷 来源:DeepHub IMBA本文约1500字,建议阅读5分钟本文为你介绍6个用于可解释性的Python框架。 随着人工智能的发展为了解决具有挑战性的问题,人们创造了更复杂、更不透明的模型。AI就
相关文献 报了蓝桥杯比赛,几乎零基础,如何准备,请大牛指导一下。谢谢? 蓝桥杯2022各组真题汇总(完整可评测)
996的事情,我总是希望一次可以把它说的透彻一些。所以我就从各个不同的维度展开吧。希望这样可以帮助大家理解什么是诗和远方,什么是当下,什么是理想,什么是现实。无论如何,真的英雄是认清了生活的真相还依然爱它的人。
「机器之心走近全球顶尖实验室:UCL多智能体强化学习研究团队」系列直播今晚第四期,来自UCL汪军教授团队的杨耀东博士将带来分享:Dealing with Non-transitivity in Two-player Zero-sum Games。
📷 来源:DeepHub IMBA本文约1700字,建议阅读5分钟在本文中,将介绍6个用于机器学习可解释性的Python框架。 随着人工智能的发展为了解决具有挑战性的问题,人们创造了更复杂、更不透明的
随着人工智能的发展为了解决具有挑战性的问题,人们创造了更复杂、更不透明的模型。AI就像一个黑匣子,能自己做出决定,但是人们并不清楚其中缘由。建立一个AI模型,输入数据,然后再输出结果,但有一个问题就是我们不能解释AI为何会得出这样的结论。需要了解AI如何得出某个结论背后的原因,而不是仅仅接受一个在没有上下文或解释的情况下输出的结果。
📷 大数据文摘转载自数据派THU 来源:DeepHub IMBA 随着人工智能的发展为了解决具有挑战性的问题,人们创造了更复杂、更不透明的模型。AI就像一个黑匣子,能自己做出决定,但是人们并不清楚其
本文整理12册容易被忽略的人工智能书籍,有经典入门内容、有理论加深内容,现在大家都很关注怎样能够更快做出结果,往往忽略了一些基础内容,这些书籍,希望各位“闲暇”时,可以“阅读”一番。
选自DeepMind 作者:Karl Tuyls、Marc Lanctot、Julian Perolat 机器之心编译 参与:刘晓坤、黄小天、路雪 近日,DeepMind 在 Scientific Report 上发表论文《Symmetric Decomposition of Asymmetric Games》,表明一个非对称博弈可以分解为多个对称博弈,从而将博弈降维,并且非对称博弈和对称变体的纳什均衡也有非常简单的对应关系。 随着 AI 系统在现实世界中扮演的角色越来越重要,理解不同系统之间如何交互变得非
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识 理性和公共知识 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 纯策略中的优势(dominance) 数学表达: 除了玩家i以外所有玩家的策略集合 : 所有人的所有策略组合。 : 除了玩家 以外,所有人的所有策略组合。 : 所有人的一种策略组合。 : 除了玩家 以外,所有人的一种策略组合。 引进 和 是为了 通过看玩家i以外的
麻将无疑是我国最家喻户晓,老少咸宜的一项棋牌游戏。近年来,随着人工智能在围棋、德州扑克、Dota、星际争霸等众多游戏中获得亮眼的成绩,AI 在麻将领域却一直缺少跨越性的突破。
约翰·冯·诺依曼 冯·诺依曼(John von Neumann,1903~1957),20世纪最重要的数学家之一,在现代计算机、博弈论、核武器和生化武器等诸多领域内有杰出建树的最伟大的科学全才之一,被后人称为“计算机之父”和“博弈论之父”。 原籍匈牙利。布达佩斯大学数学博士。先后执教于柏林大学和汉堡大学。1930年前往美国,后入美国籍。历任普林斯顿大学、普林斯顿高级研究所教授,美国原子能委员会会员。美国全国科学院院士。早期以算子理论、共振论、量子理论、集合论等方面的研究闻名,开创了冯·诺依曼代数。第二次
Alice 和 Bob 轮流从黑板上擦掉一个数字,Alice 先手。如果擦除一个数字后,剩余的所有数字按位异或运算得出的结果等于 0 的话,当前玩家游戏失败。 (另外,如果只剩一个数字,按位异或运算得到它本身;如果无数字剩余,按位异或运算结果为 0。)
Root 编译自 DeepMind官方博客 随着人工智能系统在现实世界中扮演越来越重要的角色,理解不同的系统如何相互作用至关重要。 刚刚,DeepMind发表了一篇名为Symmetric Decomp
在Alphabet大额资金支持下,DeepMind一直以实现AGI为为目标的公司在各个领域不断的尝试,做出了很多基础研究。其中最为出名的当属在强化学习方面的探索,从2013年的Atari游戏到AlphaGo的横空出世,再到终极AlphaZero的实现,完成了一次次巨大的挑战,但一个完善的环境对强化学习的发展来说是非常重要的,而DeepMind就拥有这样一个杀手锏。
博弈论(Game Theory) - 03 - 前传之最大最小均衡 开始 最大最小均衡是由人冯·诺依曼和摩根斯坦提出。冯·诺依曼和摩根斯坦也被认为是博弈论的创始人。 冯·诺依曼提出的“最大最小定理”能保证在非常一般的情况下,两人零和博弈总是存在“最大最小均衡”。 最大最小均衡存在以下问题: “最大最小”均衡没有考虑到局中人之间在策略选择上的互动。 由“最大最小”方法得到的“均衡”很难说是一种“均衡”。 零和博弈在社会科学中没有多大意义。 最大最小均衡 示例 这里,我们使用“战略式”表述一个博弈,如下:
博弈论又称对策论或竞赛论,在生活中比较常见,比如两人棋艺对弈、囚徒困境、警察与小偷道高一尺魔高一丈等都是它的典型例子,它是研究具有斗争或竞争性质现象的数学理论和方法,是运筹学的一个重要学科,它有比较鲜明的特点就是参加博弈的双方各自有自己的利益,且博弈的结果不完全取决于个人的努力而取决于对手的可能行动方案,结果也不能完全被自己左右。博弈论本身就是研究在博弈行为中斗争双方是否存在最合理(可以理解为双方损失最少收益最大双赢的结果)的方案,以及如何找到这个合理方案的理论。
领取专属 10元无门槛券
手把手带您无忧上云