人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听……

报道 | 量子位 舒石

△ 今早最新战报:人工智能Libratus已经赢了100多万美元

百万美元

年三十儿的黎明来临时,数字定格在106.5万美元。

Dong Kim充满挫败感。Kim是一个高风险扑克玩家,擅长无限注的德州扑克。通常,这位28岁的韩裔美国人在高额赌注网站或拉斯维加斯的大赌场,与其他顶级玩家谈笑风生。但是这个月,他在美国匹兹堡河流赌场,对决一台人工智能机器。

2017年以前,没有电脑在无限注德州扑克领域击败过顶级玩家。大约两年前,Kim曾在同一个赌场击败了这个人工智能的前身。但这次有所不同。上周五晚上,在这场为期二十天的比赛刚刚过半之时,Kim直言:人类已经没有真正获胜的机会。

“我直到今天才意识到它玩的有多好,那感觉就像跟一个出老千的人一起玩,好像它能看透我的牌”,Kim回到酒店房间开始为第二天做准备,“我不是指责它作弊,它就是玩得那么好”。

这个机器叫做Libratus,在拉丁文里意思是平衡。“各种套路它都用了”,Kim说这个人工智能并不会用同样的策略打牌。诈唬(bluff)的时候,它可能是一手好牌,也可能是烂牌。这意味着Kim很难在对抗中找到漏洞。如果他找到一个漏洞,第二天就会消失不见。

比赛进行十余天后,和Kim一起出战的几个顶级人类玩家说他们也许能勉强打个平手,但肯定赢不了。目前,机器已经领先了100多万美元。

对局实录

Libratus之所以能赢这么多,就是诈唬干得好。

我们来实际看一手牌。人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

匹兹堡之战

从1月11日-30日,每天上午11点-下午7点,匹兹堡河流赌场的扑克室。四位人类顶尖扑克玩家,与电脑Libratus展开德州扑克大战。

如果Libratus像预期的那样,获得最终的胜利,将是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

每一天,Libratus都会进步。而在匹兹堡,Dong Kim又累又沮丧,感觉很失败。不过,即使Libratus很快会获得最终胜利,这并不意味着卡牌桌对人类不再适合。Libratus目前的技术,还不能用于多人对局的无限注德州扑克较量之中。

相关信息

人工智能Libratus由卡内基梅隆大学计算机教授Tuomas Sandholm,和他的博士生Noam Brown共同开发。Libratus的对手,分别是扑克高手:Dong Kim,Jimmy Chou,Jason Les,Daniel McAulay。

这场对决名为:《Brains Vs. Artificial Intelligence: Upping the Ante》,大脑对战人工智能。Libratus和它的四个对手,会在这场总共12万手的一对一无限注德州扑克比赛中进行角逐。人类不仅要捍卫自身的荣誉,比赛还提供了一个20万美元的奖金包。

开发这个程序还有更多的意义。在不完美信息的博弈中,需要人工智能进行诈唬和正确解读误导信息才能获胜。像Libratus这样的程序,还可以用于洽谈商业协议、执行军事战略或计划治疗方案。所有基于不完全信息的复杂决策都可能适用。

Libratus不是唯一的扑克人工智能,几个不同的研究小组都专注于此。来自加拿大Alberta大学,捷克共和国Charles大学和捷克技术大学的一个学术团队,最近开发了一个称谓DeepStack的人工智能。这个程序也在比赛中战胜了人类。

基于深度学习,进行自我博弈之后,DeepStack学会根据具体情境进行推理:对当前情境下对个人牌面大小的判断,并作出相应的决策。

DeepStack比Libratus更早在无限注德州扑克游戏中击败人类。不过,Sandholm说Libratus面对的对手实力更强,而且比赛数据积累的更多,能够提供具有更大统计意义的结果。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

人类又双叒叕输了,就没人能管管这条“狗”吗?

1574
来自专栏量子位

独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败

舒石 希拉 发自 CMU 量子位 报道 | 公众号 QbitAI △ Sandholm教授:冷扑大师,来了~ 放下想赢的执念后,AI赌神再没输给人类。 这个A...

2665
来自专栏量子位

德扑人机大战落幕:AI赢了200万美元,这里是一份超详细的解读

作者 | 量子位 舒石 ? △ 今日凌晨产生的人机大战最终结果 176万,美元。 经过20天的鏖战之后,四位顶级人类扑克高手,在这场德州扑克人机大战中,总共输给...

3215
来自专栏量子位

那个赢了176万美元的德扑AI,马上要来中国掀起人机大战了

转载自 新浪科技 作者 李根 ? 3月24日下午消息,新浪科技今日独家获悉,卡耐基梅隆大学(Carnegie Mellon University,以下简称CM...

36710
来自专栏机器人网

为了围棋与情怀,为了豪言壮志,柯洁阿尔法终须一战

李世石与AlphaGo人机大战虽然已经过了将近2个月的时间,但由此引发的人工智能热潮却丝毫不减。中国作为围棋的发源地,柯洁作为目前人类棋手的第一人,AlphaG...

2784
来自专栏CDA数据分析师

人工智能德州扑克读懂人心后,下一个挑谁?

CDA数据分析学院的德州扑克比赛才刚刚结束,就听到AI投来的战书。听说最近人工智能又盯上了德州扑克,最近几天的人机大战也是如火如荼。如果说第一天算是2比2打平手...

2436
来自专栏量子位

输了!柯洁首战告负AlphaGo,哈萨比斯:这不是人机大战

唐旭 若朴 发自东瑶村 量子位 报道 | 公众号 QbitAI 19岁的柯洁输了。 围棋人机大战2.0版的第一场,双方交锋至第286手棋,执黑的柯洁以约四分之一...

33910
来自专栏机器之心

现场报道 | AlphaGo被授职业九段,DeepMind将公开其所有版本细节

机器之心原创 记者:杜夏德 5 月 27 日,经过 3 小时 38 分钟的鏖战,209 手,柯洁盘中投子再负 AlphaGo,至此中国乌镇围棋峰会圆满告落。赛后...

3687
来自专栏量子位

我是黄士杰,AlphaGo人肉臂

他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者...

3816
来自专栏量子位

围棋人机大战明日上演,这份观赛指南请留好

问耕 假装发自乌镇 量子位 报道 | 公众号 QbitAI ? 柯洁与AlphaGo的围棋人机大战,将于明天正式上演。以下内容是量子位整理的一份观赛指南,以及目...

2597

扫码关注云+社区