博弈论又称对策论或竞赛论,在生活中比较常见,比如两人棋艺对弈、囚徒困境、警察与小偷道高一尺魔高一丈等都是它的典型例子,它是研究具有斗争或竞争性质现象的数学理论和方法,是运筹学的一个重要学科,它有比较鲜明的特点就是参加博弈的双方各自有自己的利益,且博弈的结果不完全取决于个人的努力而取决于对手的可能行动方案,结果也不能完全被自己左右。博弈论本身就是研究在博弈行为中斗争双方是否存在最合理(可以理解为双方损失最少收益最大双赢的结果)的方案,以及如何找到这个合理方案的理论。
博弈问题的特点是会有利益互相冲突的多方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果
即有权自己做决定且实施行动方案的博弈参加者,通常用I表示局中人集合,局中人至少有两个人
即在一局博弈中可以供局中人选择的一个实际可行的策略,对于每一个局中人i,策略集为
,每个局中人的策略至少包含两个策略
在一局博弈中,各个局中人所选定的策略一起构成的策略组称为局势,若有n个局中人,则全体局势的集合S则表示成每个局中人所选策略的笛卡尔积,即
在任意一个可能的局势中,每个局中人i可以得到一个赢得函数
,显然是局势
的函数,用来衡量局中人在一轮博弈中赢得的收益
e.g.: (囚徒困境)比如有两个囚犯,如果双方都认罪,则每个人被判三年,如果双方都不认罪,则每个人判1年,若一个认罪一个不认罪,则认罪的因为坦白当堂释放,另一个判7年。这个例子中有两个局中人,每个局中人有两种策略(认罪或者不认罪),总共四种局势(1,1),(3,3),(0,7),(7,0),括号的每一个数值代表每个人的赢得值
本文主要解释博弈论中最简单的零和博弈,上述例子中的囚徒困境是典型的非零和博弈,因为两名囚徒可以合作,不是你生我死的激烈对抗型博弈
博弈中有两名局中人,策略集有限,且若双方的赢得是激烈对抗的,一个人赢得了某个值则另一个人就会损失某个值,即赢得之和等于0。
约定是每个局中人的可选策略集总数会大于2,等于2的一般直接枚举就行,不需要用规划算法
零和博弈问题其实核心就是求在双方都想让对方承担更大损失的情况下的最小风险的解,这种思想在生存分析等问题中非常有用,而这类问题难在结局往往不取决于任何一方的努力,所研究的现象与人们的政治、经济、外交、军事活动乃至一般的日常生活等有着非常密切的联系,能够接近出取胜之道的一种方法.