算法Blog之博弈原理

博弈入门

寻找平衡状态(也称必败态, 奇异局势),(满足:任意非平衡态经过一次操作可以变为平衡态)

一.巴什博奕(Bash Game)

只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。

显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。

一般方法:

步骤1:将所有终结位置标记为必败点(P点);

步骤2: 将所有一步操作能进入必败点(P点)的位置标记为必胜点(N点)

步骤3:如果从某个点开始的所有一步操作都只能进入必胜点(N点) ,则将该点标记为必败点(P点) ;

步骤4: 如果在步骤3未能找到新的必败(P点),则算法终止;否则,返回到步骤2。

二.威佐夫博奕(Wythoff Game)

有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

  这种情况下是颇为复杂的。我们用(ak,bk)(ak ≤ bk ,k=0,1,2,...,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k。

奇异局势有如下三条性质:

1。任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质1成立。

2。任意操作都可将奇异局势变为非奇异局势。

事实上,若只改变奇异局势(ak,bk)的某一个分量,那么另一个分量不可能在其他奇异局势中,所以必然是非奇异局势。如果使(ak,bk)的两个分量同时减少,则由于其差不变,且不可能是其他奇异局势的差,因此也是非奇异局势。

3。采用适当的方法,可以将非奇异局势变为奇异局势。

假设面对的局势是(a,b)

若 b = a,则同时从两堆中取走 a 个物体,就变为了奇异局势(0,0);

1. 如果a = ak,

1.1 b> bk, 那么,取走b - bk个物体,即变为奇异局势(ak, bk);

1.2 b< bk 则同时从两堆中拿走 ak– a[b – ak]个物体,变为奇异局势( a[b – ak] , a[b – ak]+ b -ak);

2 如果a = bk ,

2.1 b> ak ,则从第二堆中拿走多余的数量b– ak

2.2 b< ak ,则 若b = aj (j < k) 从第一堆中拿走多余的数量a– bj; (a > bj)

若b = bj (j < k) 从第一堆中拿走多余的数量a– aj; ( a > aj)

结论:

两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜;反之,则后拿者取胜。

那么任给一个局势(a,b),怎样判断它是不是奇异局势呢?我们有如下公式:

ak =[k(1+√5)/2],bk= ak + k (k=0,1,2,...n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数(1+√5)/2 = 1.618...因此,由ak,bk组成的矩形近似为黄金矩形,由于2/(1+√5)=(√5-1)/2,可以先求出j=[a(√5-1)/2],若a=[j(1+√5)/2],那么a = aj,bj = aj + j,若不等于,那么a = aj+1,bj+1 = aj+1 + j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异局势。

三.尼姆博奕(Nimm Game)

有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

  这种情况最有意思,它与二进制有密切关系,我们用(a,b,c)表示某种局势,首先(0,0,0)显然是奇异局势,无论谁面对奇异局势,都必然失败。第二种奇异局势是(0,n,n),只要与对手拿走一样多的物品,最后都将导致(0,0,0)。仔细分析一下,(1,2,3)也是奇异局势,无论对手如何拿,接下来都可以变为(0,n,n)的情形。

  计算机算法里面有一种叫做按位模2加,也叫做异或的运算,我们用符号(+)表示这种运算,先看(1,2,3)的按位模2加的结果:

1 =二进制01

2 =二进制10

3 =二进制11 (+)

———————

0 =二进制00 (注意不进位)

  对于奇异局势(0,n,n)也一样,结果也是0。

  任何奇异局势(a,b,c)都有a(+)b(+)c =0。

如果我们面对的是一个非奇异局势(a,b,c),要如何变为奇异局势呢?假设 a < b < c,我们只要将 c 变为 a(+)b,即可,因为有如下的运算结果: a(+)b(+)(a(+)b)=(a(+)a)(+)(b(+)b)=0(+)0=0。要将c 变为a(+)b,只要从 c中减去 c-(a(+)b)即可。

例题:

取火柴的游戏

题目1:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 可将一堆全取走,但不可不取,最后取完者为胜,求必胜的方法。

题目2:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 可将一堆全取走,但不可不取,最后取完者为负,求必胜的方法。

先解决第一个问题吧。

定义:若所有火柴数异或为0,则该状态被称为利他态,用字母T表示;否则, 为利己态,用S表示。

[定理1]:对于任何一个S态,总能从一堆火柴中取出若干个使之成为T态。

证明:

若有n堆火柴,每堆火柴有A(i)根火柴数,那么既然现在处于S态,

c = A(1) xorA(2) xor … xor A(n) > 0; 把c表示成二进制,记它的二进制数的最高位为第p位,则必然存在一个A(t),它二进制的第p位也是1。(否则,若所有的A(i)的第p位都是0,这与c的第p位就也为0矛盾)。 那么我们把x = A(t) xor c,则得到x < A(t).这是因为既然A(t)的第p位与c的第p位同为1,那么x的第p位变为0,而高于p的位并没有改变。所以x< A(t).而 A(1) xor A(2) xor … xor x xor … xor A(n) = A(1) xor A(2) xor … xor A(t) xor c xor … xor A(n) = A(1) xor A(2) xor… xor A(n) xor A(1) xor A(2) xor … xor A(n) = 0 这就是说从A(t)堆中取出 A(t) – x 根火柴后状态就会从S态变为T态。证毕 [定理2]:T态,取任何一堆的若干根,都将成为S态。 证明:用反证法试试。 若 c = A(1) xor A(2) xor … xor A(i) xor … xor A(n) = 0; c’ = A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) =0; 则有 c xor c’ = A(1) xor A(2) xor … xor A(i) xor … xor A(n) xor A(1) xor A(2) xor …xor A(i’) xor c xor … xor A(n) = A(i) xor A(i’) =0 进而推出A(i) = A(i’),这与已知矛盾。所以命题得证。 [定理 3]:S态,只要方法正确,必赢。 最终胜利即由S态转变为T态,任何一个S态,只要把它变为T态,(由定理1,可以把它变成T态。)对方只能把T态转变为S态(定理2)。这样,所有S态向T态的转变都可以有己方控制,对方只能被动地实现由T态转变为S态。故S态必赢。 [定理4]:T态,只要对方法正确,必败。 由定理3易得。 接着来解决第二个问题。 定义:若一堆中仅有1根火柴,则被称为孤单堆。若大于1根,则称为充裕堆。 定义:T态中,若充裕堆的堆数大于等于2,则称为完全利他态,用T2表示;若充裕堆的堆数等于0,则称为部分利他态,用T0表示。 孤单堆的根数异或只会影响二进制的最后一位,但充裕堆会影响高位(非最后一位)。一个充裕堆,高位必有一位不为0,则所有根数异或不为0。故不会是T态。 [定理5]:S0态,即仅有奇数个孤单堆,必败。T0态必胜。 证明: S0态,其实就是每次只能取一根。每次第奇数根都由己取,第偶数根都由对方取,所以最后一根必己取。败。同理, T0态必胜。 [定理6]:S1态,只要方法正确,必胜。 证明: 若此时孤单堆堆数为奇数,把充裕堆取完;否则,取成一根。这样,就变成奇数个孤单堆,由对方取。由定理5,对方必输。己必胜。 [定理7]:S2态不可转一次变为T0态。 证明: 充裕堆数不可能一次由2变为0。得证。

[定理8]:S2态可一次转变为T2态。 证明: 由定理1,S态可一次转变为T态,又由定理7,S2态不可转一次变为T0态,所以转变的T态为T2态。 [定理9]:T2态,只能转变为S2态或S1态。 证明: 由定理2,T态必然变为S态。由于充裕堆数不可能一次由2变为0,所以此时的S态不可能为S0态。命题得证。 [定理10]:S2态,只要方法正确,必胜. 证明: 方法如下: 1) S2态,就把它变为T2态。(由定理8) 2) 对方只能T2转变成S2态或S1态(定理9) 若转变为S2, 转向1) 若转变为S1, 这己必胜。(定理6) [定理11]:T2态必输。 证明:同10。 综上所述,必输态:T2,S0 ;必胜态: S2,S1,T0。 两题比较: 第一题的全过程其实如下: S2->T2->S2->T2-> …… ->T2->S1->T0->S0->T0->……->S0->T0(全0) 第二题的全过程其实如下: S2->T2->S2->T2-> …… ->T2->S1->S0->T0->S0->……->S0->T0(全0) 下划线表示胜利一方的取法。是否发现了他们的惊人相似之处。

我们不难发现(见加粗部分),S1态可以转变为S0态(第二题做法),也可以转变为 T0(第一题做法)。哪一方控制了S1态,他即可以有办法使自己得到最后一根(转变为 T0),也可以使对方得到最后一根(转变为S0)。

所以,抢夺S1是制胜的关键!

为此,始终把T2态让给对方,将使对方处于被动状态,他早晚将把状态变为S1。

后继点和SG值的问题: SG值:一个点的SG值就是一个不等于它的后继点的SG的且大于等于零的最小整数。 后继点:也就是按照题目要求的走法(比如取石子可以取的数量,方法)能够走一步达到的那个点。

1536的参考代码 本部分设定了隐藏,您已回复过了,以下是隐藏的内容 Copy code //博弈-基于求SG值 //Accepted 1536 578MS 416K 904 B #include”iostream” using namespace std; int f[101],sg[10001],k; int mex(int b) { int a[101]={0},i; for(i=0;i<k;i++) { if(b-f<0)//b-f后继点 break; if(sg[b-f]==-1) { sg[b-f]=mex(b-f); } a[sg[b-f]]=1; } for(i=0;i<k;i++) if(!a) { return i; } } int main() { int i,t,n,s,bead,j; while(cin >> k,k) { for(i=0;i<k;i++) { cin >> f; } memset(sg,-1,sizeof(sg)); for(i=0;i<k;i++) for(j=i+1;j<k;j++) if(f>f[j]) { f+=f[j]; f[j]=f-f[j]; f-=f[j]; } sg[0]=0; cin >> t; while(t–) { cin >> n; s=0; while(n–) { cin >> bead;//该堆的成员个数 if(sg[bead]==-1) sg[bead]=mex(bead); s=s^sg[bead]; } if(s==0) cout << “L”; else cout << “W”; } cout << endl; } return 0; }

1517参考代码 本部分设定了隐藏,您已回复过了,以下是隐藏的内容 Copy code //博弈-基于求SG值 //Accepted 1517 234MS 0K 837 B #include”iostream” using namespace std; int main() { __int64 a[7000]={1},min,n; int p[10],sg[7000],i,j,k; for(i=2;i<10;p=0,i++); for(i=1;i<7000;i++) { for(j=2,min=-1;j<10;j++) if(min==-1||a[p[j]]*j<a[p[min]]*min) min=j; a=a[p[min]]*min; min=a[p[min]]*min; if(a>=5000000000) break; for(j=2;j<10;j++) if(a[p[j]]*j==min) p[j]++; }//从小到大求出所有乘积 while(scanf(“%I64d”,&n)!=EOF) { for(i=0;i<7000;i++) { sg=0; if(a>=n) break; } for(j=i-1;a[j]*9>=n&&j>=0;j–) sg[j]=1; while(j>=0) { for(k=j+1;k<i&&a[j]*9>=a[k];k++) if(a[k]%a[j]==0&&sg[k]==0) { sg[j]=1; break; } j–; } puts(sg[0]?”Stan wins.”:”Ollie wins.”); } return 0; }

原文发布于微信公众号 - 数据库SQL(SQLdba)

原文发表时间:2016-11-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

赫尔辛基大学AI基础教程:搜索和游戏(2.3节)

在本节中,我们将研究一个经典的AI问题:游戏。为了清晰起见,我们将重点关注的最简单的场景是双人游戏,如井字棋和国际象棋等完全信息游戏。

683
来自专栏贾老师の博客

启发式寻路算法

1373
来自专栏数据魔术师

干货 | 变邻域搜索算法(VNS)求解TSP(附C++详细代码及注释)

上次变邻域搜索的推文发出来以后,看过的小伙伴纷纷叫好。小编大受鼓舞,连夜赶工,总算是完成了手头上的一份关于变邻域搜索算法解TSP问题的代码。今天,就在此...

1282
来自专栏Crossin的编程教室

【编程课堂】jieba-中文分词利器

0、前言 在之前的文章【编程课堂】词云 wordcloud 中,我们曾使用过 jieba 库,当时并没有深入讲解,所以本次将其单独列出来详细讲解。 jieba库...

32811
来自专栏鹅厂优文

游戏人工智能 读书笔记 (五) AI算法简介——树搜索

本书英文版: Artificial Intelligence and Games - A Springer Textbook

1385
来自专栏racaljk

博弈之最大-最小搜索算法

最近正在做一个人工智能的中国象棋,所以不可避免的接触到了博弈论,因为考虑到以后还会有所涉及 (alpha-beta search),所以写成了一片文章

602
来自专栏marsggbo

什么是P问题、NP问题和NPC问题

    这或许是众多OIer最大的误区之一。     你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你...

672
来自专栏技术总结

算法(1)

2257
来自专栏阿凯的Excel

剔除两侧极值求平均

祝新的一年,各位表亲财源广进! 不知道过年期间是否安好哇! 请各位表亲好好断句,不要说错话! 像小编这种英俊潇洒风流倜傥的,身边难免有很多选择。 我可以允...

2352
来自专栏小红豆的数据分析

小蛇学python(14)K-means预测花朵种类

承接上一篇有关如何处理数据的文章,这一篇,我们来一次实战,让大家感受一下这个过程。

734

扫描关注云+社区