AI 科技评论消息:当地时间 1 月 30 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的人工智能系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利。
据官网介绍,此次由四名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,赛程为 20 天,一共进行了 12 万手牌的比赛。
2015 年,CMU 曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中,代表 CMU 出战的是另外一款人工智能系统“Claudico”,同样也有四名职业扑克玩家参加了比赛,然而,Claudico 并未获得最终胜利。
不过 CMU 学者认为,当时扑克职业玩家仅与 Claudico 进行了8万手牌的比赛,就统计学角度来讲并无法证明人类职业扑克玩家或人工智能具有优势。这也是本轮巡回赛中比赛的牌局数量增加 50% 的原因。
德州扑克的玩法:每个玩家有两张牌作为“底牌”,同时还有五张公共牌。玩家选择五张公共牌里的三张,与手里的两张底牌组合,最后以期得到最好的五张牌的组合。按照“Card Ranking”决定最后的胜者。
由于对方的“底牌信息”是隐藏信息,对于计算机来说,就是在处理一种“不完全信息博弈”。而围棋对弈双方的信息是完整的、对称的,并没有隐藏的信息。Libratus 此次战胜顶级人类德州扑克选手,具有非常重要的意义。
计算机正确决定,依赖于对方“底牌信息”情况下的概率分布,这种“底牌信息”可以通过对手过去的行为显露出来。比如有时玩家采取“诈唬”(Bluffing)策略——对手有时手里并没有强牌,但还是作出全额下注志在必得的行为,计算机这时要根据对方过去的博弈表现,来判断对手有强牌的概率。 相应的,对手也会推断我方的底牌信息,所以这里就是一个“递归推理”(recursive reasoning),一个玩家无法轻易推理博弈状况。
继围棋和德州扑克之后,人工智能的下一站会是哪个游戏呢?