前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

作者头像
量子位
发布2018-01-30 15:17:59
8420
发布2018-01-30 15:17:59
举报
文章被收录于专栏:量子位量子位

今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听……

报道 | 量子位 舒石

△ 今早最新战报:人工智能Libratus已经赢了100多万美元
△ 今早最新战报:人工智能Libratus已经赢了100多万美元

百万美元

年三十儿的黎明来临时,数字定格在106.5万美元。

Dong Kim充满挫败感。Kim是一个高风险扑克玩家,擅长无限注的德州扑克。通常,这位28岁的韩裔美国人在高额赌注网站或拉斯维加斯的大赌场,与其他顶级玩家谈笑风生。但是这个月,他在美国匹兹堡河流赌场,对决一台人工智能机器。

2017年以前,没有电脑在无限注德州扑克领域击败过顶级玩家。大约两年前,Kim曾在同一个赌场击败了这个人工智能的前身。但这次有所不同。上周五晚上,在这场为期二十天的比赛刚刚过半之时,Kim直言:人类已经没有真正获胜的机会。

“我直到今天才意识到它玩的有多好,那感觉就像跟一个出老千的人一起玩,好像它能看透我的牌”,Kim回到酒店房间开始为第二天做准备,“我不是指责它作弊,它就是玩得那么好”。

这个机器叫做Libratus,在拉丁文里意思是平衡。“各种套路它都用了”,Kim说这个人工智能并不会用同样的策略打牌。诈唬(bluff)的时候,它可能是一手好牌,也可能是烂牌。这意味着Kim很难在对抗中找到漏洞。如果他找到一个漏洞,第二天就会消失不见。

比赛进行十余天后,和Kim一起出战的几个顶级人类玩家说他们也许能勉强打个平手,但肯定赢不了。目前,机器已经领先了100多万美元。

对局实录

Libratus之所以能赢这么多,就是诈唬干得好。

我们来实际看一手牌。人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

匹兹堡之战

从1月11日-30日,每天上午11点-下午7点,匹兹堡河流赌场的扑克室。四位人类顶尖扑克玩家,与电脑Libratus展开德州扑克大战。

如果Libratus像预期的那样,获得最终的胜利,将是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

每一天,Libratus都会进步。而在匹兹堡,Dong Kim又累又沮丧,感觉很失败。不过,即使Libratus很快会获得最终胜利,这并不意味着卡牌桌对人类不再适合。Libratus目前的技术,还不能用于多人对局的无限注德州扑克较量之中。

相关信息

人工智能Libratus由卡内基梅隆大学计算机教授Tuomas Sandholm,和他的博士生Noam Brown共同开发。Libratus的对手,分别是扑克高手:Dong Kim,Jimmy Chou,Jason Les,Daniel McAulay。

这场对决名为:《Brains Vs. Artificial Intelligence: Upping the Ante》,大脑对战人工智能。Libratus和它的四个对手,会在这场总共12万手的一对一无限注德州扑克比赛中进行角逐。人类不仅要捍卫自身的荣誉,比赛还提供了一个20万美元的奖金包。

开发这个程序还有更多的意义。在不完美信息的博弈中,需要人工智能进行诈唬和正确解读误导信息才能获胜。像Libratus这样的程序,还可以用于洽谈商业协议、执行军事战略或计划治疗方案。所有基于不完全信息的复杂决策都可能适用。

Libratus不是唯一的扑克人工智能,几个不同的研究小组都专注于此。来自加拿大Alberta大学,捷克共和国Charles大学和捷克技术大学的一个学术团队,最近开发了一个称谓DeepStack的人工智能。这个程序也在比赛中战胜了人类。

基于深度学习,进行自我博弈之后,DeepStack学会根据具体情境进行推理:对当前情境下对个人牌面大小的判断,并作出相应的决策。

DeepStack比Libratus更早在无限注德州扑克游戏中击败人类。不过,Sandholm说Libratus面对的对手实力更强,而且比赛数据积累的更多,能够提供具有更大统计意义的结果。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 百万美元
  • 对局实录
  • 匹兹堡之战
  • 相关信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档