人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听……

报道 | 量子位 舒石

△ 今早最新战报:人工智能Libratus已经赢了100多万美元

百万美元

年三十儿的黎明来临时,数字定格在106.5万美元。

Dong Kim充满挫败感。Kim是一个高风险扑克玩家,擅长无限注的德州扑克。通常,这位28岁的韩裔美国人在高额赌注网站或拉斯维加斯的大赌场,与其他顶级玩家谈笑风生。但是这个月,他在美国匹兹堡河流赌场,对决一台人工智能机器。

2017年以前,没有电脑在无限注德州扑克领域击败过顶级玩家。大约两年前,Kim曾在同一个赌场击败了这个人工智能的前身。但这次有所不同。上周五晚上,在这场为期二十天的比赛刚刚过半之时,Kim直言:人类已经没有真正获胜的机会。

“我直到今天才意识到它玩的有多好,那感觉就像跟一个出老千的人一起玩,好像它能看透我的牌”,Kim回到酒店房间开始为第二天做准备,“我不是指责它作弊,它就是玩得那么好”。

这个机器叫做Libratus,在拉丁文里意思是平衡。“各种套路它都用了”,Kim说这个人工智能并不会用同样的策略打牌。诈唬(bluff)的时候,它可能是一手好牌,也可能是烂牌。这意味着Kim很难在对抗中找到漏洞。如果他找到一个漏洞,第二天就会消失不见。

比赛进行十余天后,和Kim一起出战的几个顶级人类玩家说他们也许能勉强打个平手,但肯定赢不了。目前,机器已经领先了100多万美元。

对局实录

Libratus之所以能赢这么多,就是诈唬干得好。

我们来实际看一手牌。人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

匹兹堡之战

从1月11日-30日,每天上午11点-下午7点,匹兹堡河流赌场的扑克室。四位人类顶尖扑克玩家,与电脑Libratus展开德州扑克大战。

如果Libratus像预期的那样,获得最终的胜利,将是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

每一天,Libratus都会进步。而在匹兹堡,Dong Kim又累又沮丧,感觉很失败。不过,即使Libratus很快会获得最终胜利,这并不意味着卡牌桌对人类不再适合。Libratus目前的技术,还不能用于多人对局的无限注德州扑克较量之中。

相关信息

人工智能Libratus由卡内基梅隆大学计算机教授Tuomas Sandholm,和他的博士生Noam Brown共同开发。Libratus的对手,分别是扑克高手:Dong Kim,Jimmy Chou,Jason Les,Daniel McAulay。

这场对决名为:《Brains Vs. Artificial Intelligence: Upping the Ante》,大脑对战人工智能。Libratus和它的四个对手,会在这场总共12万手的一对一无限注德州扑克比赛中进行角逐。人类不仅要捍卫自身的荣誉,比赛还提供了一个20万美元的奖金包。

开发这个程序还有更多的意义。在不完美信息的博弈中,需要人工智能进行诈唬和正确解读误导信息才能获胜。像Libratus这样的程序,还可以用于洽谈商业协议、执行军事战略或计划治疗方案。所有基于不完全信息的复杂决策都可能适用。

Libratus不是唯一的扑克人工智能,几个不同的研究小组都专注于此。来自加拿大Alberta大学,捷克共和国Charles大学和捷克技术大学的一个学术团队,最近开发了一个称谓DeepStack的人工智能。这个程序也在比赛中战胜了人类。

基于深度学习,进行自我博弈之后,DeepStack学会根据具体情境进行推理:对当前情境下对个人牌面大小的判断,并作出相应的决策。

DeepStack比Libratus更早在无限注德州扑克游戏中击败人类。不过,Sandholm说Libratus面对的对手实力更强,而且比赛数据积累的更多,能够提供具有更大统计意义的结果。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

柯洁1/4子惜败,机器之心独家对话AlphaGo开发者导师 Martin Müller

机器之心报道 参与:杜夏德、李泽南 第一战,AlphaGo 赢了!几乎不出人意料。 5 月 23 日,中国围棋协会和浙江省体育局携手谷歌联合主办的「中国乌镇·...

2878
来自专栏机器之心

深度 | 升级版AlphaGo 5月决战柯洁,DeepMind揭秘计算机全新棋风

机器之心原创 参与:李泽南、李亚洲、吴攀 4 月 10 日下午,谷歌在北京的中国棋院召开新闻发布会,正式宣布 AlphaGo 将于今年 5 月 23 日在浙江乌...

36310
来自专栏量子位

那个赢了176万美元的德扑AI,马上要来中国掀起人机大战了

转载自 新浪科技 作者 李根 ? 3月24日下午消息,新浪科技今日独家获悉,卡耐基梅隆大学(Carnegie Mellon University,以下简称CM...

38110
来自专栏量子位

独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败

舒石 希拉 发自 CMU 量子位 报道 | 公众号 QbitAI △ Sandholm教授:冷扑大师,来了~ 放下想赢的执念后,AI赌神再没输给人类。 这个A...

2745
来自专栏量子位

人机大战简史:AI如何在20多年中一次次赶超人类

△ 1996年2月卡斯帕罗夫与深蓝的首场对决 量子位 | 若朴 编译整理 二十一年前的2月,国际象棋人机大战上演。 IBM的超级电脑深蓝,因与国际象棋世界冠军卡...

3627
来自专栏AI科技评论

柯洁说“输得没脾气”?8个问题解读人机大战第一局

AI科技评论消息,经过四个多小时的对弈,柯洁以四分之一子之差败给了AlphaGo。 比赛后,曾参与训练AlphaGo的棋手樊麾,与围棋九段常昊一同回顾了整个对弈...

2716
来自专栏镁客网

人类又双叒叕输了,就没人能管管这条“狗”吗?

1614
来自专栏量子位

围棋人机大战明日上演,这份观赛指南请留好

问耕 假装发自乌镇 量子位 报道 | 公众号 QbitAI ? 柯洁与AlphaGo的围棋人机大战,将于明天正式上演。以下内容是量子位整理的一份观赛指南,以及目...

2627
来自专栏机器人网

为了围棋与情怀,为了豪言壮志,柯洁阿尔法终须一战

李世石与AlphaGo人机大战虽然已经过了将近2个月的时间,但由此引发的人工智能热潮却丝毫不减。中国作为围棋的发源地,柯洁作为目前人类棋手的第一人,AlphaG...

2834
来自专栏量子位

我是黄士杰,AlphaGo人肉臂

他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者...

3896

扫码关注云+社区

领取腾讯云代金券