首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

决策博弈

听到 决策 ,你是不是想到了人工智能的算法? 你还记得史努比这只可爱的小狗吗?它的主人是查理 · 布朗(Charlie Brown),那个头上只有几根毛的可爱的男孩子。...而无论是搭乘上述任何交通工具,每种交通工具都有几个不同的选择,这些选择用决策来描述分析的话,如下图。 ? 而查理 · 布朗的故事,用博弈分析的话,是这样的: ? 要不要进入新市场? ?...有了这棵包含所有信息的博弈,就可以预计双方的招数。 对于任何一个相继选择且数目有限的博弈,总是存在某种最佳策略。...策略性的决策被称为博弈论。 策略博弈有两种:决策和影响相继进行;决策和影响同时进行。 相继出招的策略博弈的法则是:向前展望,倒后推理。...决策适用于一个人面临各种选择时的描述分析,而博弈则适用于多个参与者在一场策略博弈中的决策次序的描述分析。 简宝玉读书挑战打卡-《策略思维》读书感悟1

1.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

浅析博弈论中的零和博弈

博弈论本身就是研究在博弈行为中斗争双方是否存在最合理(可以理解为双方损失最少收益最大双赢的结果)的方案,以及如何找到这个合理方案的理论。 ?...描述 博弈问题的特点是会有利益互相冲突的多方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果 局中人 即有权自己做决定且实施行动方案的博弈参加者,通常用I表示局中人集合,局中人至少有两个人...策略集 即在一局博弈中可以供局中人选择的一个实际可行的策略,对于每一个局中人i,策略集为 ,每个局中人的策略至少包含两个策略 局势 在一局博弈中,各个局中人所选定的策略一起构成的策略组称为局势,若有...本文主要解释博弈论中最简单的零和博弈,上述例子中的囚徒困境是典型的非零和博弈,因为两名囚徒可以合作,不是你生我死的激烈对抗型博弈 零和博弈 博弈中有两名局中人,策略集有限,且若双方的赢得是激烈对抗的,一个人赢得了某个值则另一个人就会损失某个值...约定和推导 image.png 零和博弈的混合策略 image.png 零和博弈的线性规划解法 约定是每个局中人的可选策略集总数会大于2,等于2的一般直接枚举就行,不需要用规划算法 image.png

94320

博弈论入门之威佐夫博弈

威佐夫博弈 威佐夫博弈是一类经典的博弈问题 有两堆石子,两个顶尖聪明的人在玩游戏,每次每个人可以从任意一堆石子中取任意多的石子或者从两堆石子中取同样多的石子,不能取得人输,分析谁会获得胜利 博弈分析...威佐夫博弈不同于Nim游戏与巴什博奕,它的特殊之处在于不能将两堆石子分开分析。...前辈们在对该博弈游戏做了大量的探索之后最终找到了一些非常有意思的性质 下面的内容不想看的可以跳过直接看结论,其实也没啥乱用233,这部分就是为了拓宽视野的 定义先手必输的局势为奇异局势,前几个奇异局势为...必将成为非奇异局势 若同时取走,因为同一个差值只会对应一种奇异局势,必将成为非奇异局势 可以采取适当的方法将非奇异局势变为奇异局势 显然 结论 人们通过对上述性质的探索,同时结合Betty定理,给出了威佐夫博弈的重要结论...怎么样,博弈论是不是很神奇?

1.3K40

博弈论基础_博弈论基础罗伯特

参考文献 特别鸣谢孙大佬的PPT和精彩讲解 威佐夫博弈 尼姆博弈 SG函数 斐波那契博弈 区间最值查询 ST表详解 预处理 查询 巴什博弈 问题模型 只有一堆n个物品,两个人轮流从这堆物品中取物...而威佐夫博弈正好是1.618,这就是博弈的奇妙之处!...由【任意两堆数量相同的石子博弈情况为先手必输】再加上1,1,1情况先手必赢,我们开始进行总结。...Nim游戏是博弈论中最经典的模型(之一?),它又有着十分简单的规则和无比优美的结论,由这个游戏开始了解博弈论恐怕是最合适不过了。...pid=1846 解法一: 巴什博弈: 解法二: SG函数 HUD 1847 解法一 巴什博弈 解法二 SG函数 HDU 1848 SG定理 游戏和的SG函数等于各个游戏SG函数的Nim和(

55710

各种博弈问题

pid=1944 博弈算法入门小节 1536 1517 1907 小子最近迷途于博弈之中。。。感触颇深。...为了让大家能够在学习博弈的时候少走弯路,最重要的也是为了加深自己的影响,温故而知新,特发此贴与大家共勉。 学博弈先从概念开始: 特别推荐LCY老师的课件:博弈入门。...tid=6875 这个课件个人认为从博弈的基本思想,一直到解博弈的中心算法做了很好的诠释。但是特别要注意的是。课件后面一部分英语写的讲义是重中之重。小子英语很弱,在这困扰很久。...可以放在后面做做 看到这里推荐大家做几道题:1846(最简单的博弈水题) 1847(求SG值) 有了上面的知识接下来我们来看看组合博弈(n堆石子) 推荐大家看个资料: 博弈-取石子游戏(推荐等级五星级)...小子恭喜你~你博弈入门了~~~~ 这里告诉大家。博弈很强大。学习要耐心~谢谢!

62630

博弈论分析题_博弈

如果不知道巴什博弈的可能会觉得这个是个有运气成分的问题,但是如果知道的人一定知道怎样一定可以赢。...好了到这巴什博弈的精髓基本就OK了。 那么如果我们要报到n+1,每次最多报n个,最少报1个的话,后者一定能够赢。...好了,如果你不知道这个博弈定理,对于小数目的火柴棍数,可能还能推出来,但是如果火柴棍数一多,就不行了。看了下面的这个介绍,你也会有一种被骗的感觉。...而威佐夫博弈正好是1.618,这就是博弈的奇妙之处! 下面来看看威佐夫博弈常见的三类问题: 1)给你一个局面,让你求是先手输赢。 有了上面的分析,那么这个问题应该不难解决。...也就是尼姆博弈(Nimm Game)。 必败局面:也叫奇异局势。无论做出何出操作,最终结果都是输的局面。必败局面经过2次操作后,可以达到另一个必败局面。

62520

博弈 个人 见解

由于周測被虐,做了好久的博弈题,找了好多关于博弈的相关资料,感觉自己,似乎还是动了那么一点点。临睡前,就小小的总结一下,希望以后看到的时候,可以有所感悟吧!! 接下来是正题。...讲到博弈, 事实上也就是找规律,可是知道一般的博弈类型能够高速便捷的解决这个问题。 博弈的类型大致有下面几种:巴什博弈,威佐夫博奕,尼姆博弈。除此之外还有斐波那契博弈,sg模板等。...巴什博弈主要内容是:n%(m+1)是否为零。...尼姆博弈的主要内容就是:对每堆的数量进行异或运算 Fibonacci’s Game(斐波那契博弈) 斐波那契博弈模型,大致上是这种: 有一堆个数为 n 的石子,游戏两方轮流取石子,满足: 1....经常使用的博弈类型,基本就是这些。以后碰见很多其它的再来补充。

26820

读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈

有限地重复的博弈 有限地重复的博弈(Finitely Repeated Games) 给定一个阶段博弈G,一个有限地重复的博弈被记做G(T, ),其中阶段博弈G被连续进行了T次, 是公共折扣因子...推论 10.1 如果有限重复博弈的阶段博弈有一个唯一的纳什博弈, 则这个有限重复博弈有一个唯一的子博弈精炼均衡。...不依赖历史的无限重复博弈中阶段博弈,其纳什均衡就是重复博弈的子博弈精炼均衡。...读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识 读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识 读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈...可信性和序贯理性 读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈 读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈

1.3K70

详解强化学习多智能体博弈算法——蒙特卡洛搜索

1 算法原理 对于大多数的棋类游戏,我们可以把游戏过程抽象成在一个博弈(Game Tree)上进行决策的过程。...基于博弈的启发式搜索算法虽然在搜索空间相对较小的棋类游戏中取得了很大成功,但是对于搜索空间很大的棋类游戏,比如围棋,局限于当前的硬件资源,搜索深度并不能达到击败人类的程度。...其中,博弈的每个结点代表当前棋局所处的状态,包含当前状态的价值估计、当前结点被选择的先验概率、当前结点被选择的次数、当前结点的父结点(Parent)和当前结点的子结点(Children)。...4 算法的博弈表示 为了能够进行蒙特卡洛搜索,我们需要定义博弈的结点。这个结点需要具有以下特征:能够存储价值函数  ,能够记录结点被访问的次数  ,以及对应的先验概率  。...5 算法的搜索执行过程 在定义完博弈结点后,我们需要考虑的是如何从博弈出发执行蒙特卡洛搜索算法,具体可以参考以下代码。

2K30

读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈

多阶段博弈 多阶段博弈 多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。...多阶段博弈:收益 - 折扣累计和收益(discounted sum payoff) 多阶段博弈:策略 “如果在博弈1,博弈2,。。。博弈t-1中发生了这些,我会在博弈 t 中采取行动a。”...(胡萝卜大棒理论) 推论9.3 在一个由有限个阶段博弈组成的多阶段博弈中,每个阶段博弈都有一个唯一的纳什均衡, 则这个多阶段博弈有一个唯一的子博弈精炼均衡。...读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识 读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识 读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈...纳什均衡 读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略 读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈

2K100

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券