以“Scissors-Paper-Rock(SPR)”游戏为例(就是猜拳),如果我们在对手出布的时候出了石头,我们就后悔没有出剪子。
?...按惯例,我们定义行的玩家是玩家1,列的玩家是玩家2.因此,为了查询给定动作剖析(s1 = Rock,s2 = Paper)的玩家1的实用值,我们调用utilities.loc['ROCK', 'PAPER...class RPS:
actions= ['ROCK','PAPER','SCISSORS']
n_actions= 3
utilities= pd.DataFrame([...# ROCK PAPER SCISSORS
[0, -1, 1],# ROCK
[1, 0, -1],# PAPER
[-1,...考虑到行动剖析(Rock,Paper),不采取行动相应的遗憾基本上是行动与对手行为之间的效用差异,即(Rock = -1,Scissor = 1,Paper = 0),剪刀被明确的舍弃了。