我们现在准备攀爬博弈论的几座高峰。 我们先看看在纳什均衡产生之前,博弈论的发展情况。 我们的第一座高峰是占优战略均衡。
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持抵赖,此人将即时获释,沉默者将判监10年。 若二人都保持抵赖(相关术语称互相“合作”),则二人同样判监1年。 若二人都互相坦白(相关术语称互相“背叛”),则二人同样判监8年。 如果你是其中一个囚徒,你该怎么办?
博弈论表述问题的方式有:
这里,我们使用“战略式”表述,其支付矩阵如下:
乙 | |||
---|---|---|---|
坦白 | 抵赖 | ||
甲 | 坦白 | -8,-8 | 0,-10 |
抵赖 | -10,0 | -1,-1 |
这个表中的数字,第一个是甲的支付结果,第二个是乙的支付结果。 比如:右上角的单元中,表示:在甲选择坦白,乙选择抵赖时,甲被释放,而乙获刑10年。
首先,我们假设每个人都是理性人。 甲会如何考虑呢? 甲会先不考虑自己做出什么选择。他会先假设乙的选择是什么? 如果乙选择坦白,则甲选坦白,获刑8年;或者选择抵赖,获刑10年。这种情况下,甲选择坦白占优。 如果乙选择抵赖,则甲选坦白,获刑0年;或者选择抵赖,获刑1年。这种情况下,甲选择坦白占优。 因此,对于甲来说,选择坦白就是一个占优选择。
当然,坦白也是乙的占优战略。 这种场景下,甲和乙都选择了最优战略,不会再改变自己的战略,达到了均衡。