前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >德扑人机大战落幕:AI赢了200万美元,这里是一份超详细的解读

德扑人机大战落幕:AI赢了200万美元,这里是一份超详细的解读

作者头像
量子位
发布于 2018-03-21 06:38:47
发布于 2018-03-21 06:38:47
7170
举报
文章被收录于专栏:量子位量子位

作者 | 量子位 舒石

今日凌晨产生的人机大战最终结果

176万,美元。

经过20天的鏖战之后,四位顶级人类扑克高手,在这场德州扑克人机大战中,总共输给人工智能(AI)选手共计176.6万美元。四天之前,这个数字仅仅是106万美元。

如果这场大战继续下去,也许人类高手们还要在匹兹堡的河流赌场输得更多。

AI一路碾压人类高手

怎么描述这20天令“人”精疲力尽的比赛?量子位觉得,还是先放一张图表吧。一图胜千言~

这张图代表了从1月11日比赛开始,到1月30日比赛落幕,人工智能德州扑克选手Libratus的每日战绩。在整整二十天的时间里,Libratus没有一天以输钱告终:从第一天“仅仅”赢下7万美元,直到最后一天累积下200多万美元的优势。

曲线清楚的告诉我们,整个比赛期间,人工智能至少有两天明显出现了状态下滑。然而人类选手们没有一次能够把胜利延续下去。

整个比赛期间,Dong Kim都充满挫败感,而他已经是四位人类高手里面,对战成绩最好的那个。大约两年前,Kim曾在同一个赌场击败了这个人工智能的前身。在这场为期二十天的比赛刚刚过半之时,Kim就直言:人类已经没有真正获胜的机会。

每一天,Libratus都会进步。人类选手很难找到它的漏洞。即便找到一个漏洞,第二天就会消失不见。上面的曲线也正说明了这一点。

而且之前的最终战果也表明,四位人类高手里面,Dong Kim输得最少:总计8.5万美元;而Jason Les输的最多:88万美元。

揭秘:复盘AI的德州扑克战术

AI究竟是怎么打德州扑克的?来,我们复盘两局看一下。

第一盘 人类赢了

每一局都有200盲注。

Kim这局是庄家,下注274。Libratus跟。首三张公共牌是:黑桃6,红桃5,黑桃4。机器下注274,Kim跟。第四张开出的公共牌是:红桃8。Libratus再次下注274,而Kim则直接下注3151。Libratus的选择是继续跟。

最后一张公共牌是:黑桃9。这意味着,牌局有可能出现“同花”。电脑直接下注15000,再次把赌注翻番。Kim有点犹豫,但还是跟进开牌:他手上是个最高为9的顺子。而Libratus手上是一张黑桃8,和一张梅花8,显然刚才电脑是在诈唬。

第二盘 AI赢了

人类高手Jason Les当时以一对10开局,一张是方片,一张是红桃。翻牌之后,首三张公共牌是:K、9、4,其中有两张梅花。下注继续。在这种局面下,AI按理说应该希望再出一张梅花,凑成一个同花。

第四张公共牌,发出一张5,不是梅花。当时,两边都已经看牌。最后一张公共牌,是一张Q,也不是梅花。然后,人工智能突然压上了所有的筹码。

面对这个局面,Les选择不跟。人工智能赢下一手。

与此同时,Les的拍档Dong Kyu也在一模一样的局面里,但是又有所不同。为了消除运气的影响,这次人工智能和人类玩家的对决,被安排成两对一模一样的牌局。区别是,在镜像局里人类玩家和人工智能手上拿到的牌,进行了对调。

Kyu手上是梅花7和梅花3。这意味着,在主局里面对人工智能的疯狂押注,Les如果果断跟进的话,绝对是稳赢的一手牌。雪上加霜的是,在镜像局Libratus早早为手上的一对10下了重注,最后Kyu也选择不跟,放弃了这手牌。

Libratus经常特别激进的下注,下注的额度远远超过底池里的额度。“其实人类并不这样,通常不会为了赢一点钱,冒着输掉很多钱的风险”,扑克高手Doug Polk说,“但人工智能没有这种心理,它只看怎么玩更好”。

会打扑克的AI有什么用?

Libratus在德州扑克人机大战中获得最终的胜利,是人工智能领域的巨大成就。玩扑克需要推理能力,而这对于机器来说很难模仿。虽然人工智能在跳棋、象棋乃至围棋比赛中,已经完胜人类对手,但无限注德州扑克是一个完全不同的情况。

这是一场“不完美信息”游戏。

由于一些卡牌并没有发出来,在德州扑克的对局里,任意时间,任何一个玩家,都只能观察到一部分的情况。要赢,他们需要直觉:一种猜测其他玩家手上是什么牌的能力。而且还要考虑到对手每一种可能的打法,想得到理想的战略非常困难。

现实世界中,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈。在围棋界纵横无敌的AlphaGo,本质上处理的还是完美信息博弈,而AlphaGo无法处理德州扑克的问题,更遑论使出诈唬。

未来Libratus这样的AI,可以用于商业谈判、网络安全、医疗方案制定等领域。

去年,Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。Sandholm解释说,Libratus的水平提升基于几个技术进步,包括一个新的平衡近似技术,以及几种新的方法来分析可能的结果。

人工智能发展的终极目标,是通用人工智能(AGI)。通用人工智能可以解决任何一个问题,而不是像Libratus或者AlphaGo这样只能专注于扑克或者围棋。想要实现AGI就得让人工智能学会解决不确定性问题,这也是此次人机大战的重大意义之一。

在下面这段视频里,Libratus的两位创建者,详细解释了扑克人工智能的重大意义。

人机大战背后的超级计算机

每个牌局结束后的夜晚,匹兹堡超级计算中心的Bridges电脑执行计算,用以优化Libratus的策略。而在白天的比赛过程中,Bridges用于计算每一手的终结游戏策略。

Libratus来自卡内基梅隆大学,而Bridges又是谁?

Bridges不是当今世界最大、最快、最强劲的超级计算机。但它可能是面向公众开放的,最大、最快、最强劲的超级计算机。

研究生物学、地质学、考古学、经济学和其他社会科学的科学家们,都可以得到Bridges的帮助。而此前,这些科学家通常没有机会利用超级计算机,来处理相关领域的大量数据。而这就是Bridges最大的意义所在。

卡内基梅隆大学(还是这个大学,因为它就位于匹兹堡)的教授Jay Apt说,在Bridges的帮助下,原本在个人电脑上要耗时数月的计算,仅仅几个小时就搞定了。

超级计算机本质上是几个计算机联网在一起,以一个整体进行运算。通常要使用2500个电缆连接组件,如果连在一起,可以绕地球……不是,大约是7.2公里。

Bridges的机房有一个双锁的大门,需要用钥匙卡和访问码才能进入。Bridges由27个机架组成,每个大约1.8米高,堆叠的计算机共有三排。冷气从地泵吸入用以冷却。

Bridges提供三种类型的计算选项,称为节点:常规、大型和超大型。常规内存节点具有128GB内存,大约是高端笔记本计算能力的8倍。常规节点共有800个。

Libratus在600-700个节点上运行,这些节点的小子集在打牌时做出决定。而其余的工作则是改善Libratus,让这个人工智能程序可以玩得更好。

最后看看这个赌场

上面放了好多德州扑克人机大战的照片,但多是河流赌场的内景。其实这个赌场就位于一条河流的旁边,夕阳西下,华灯初上的时候,还挺漂亮。

这张是赌场白天的全景。

现在,这场赌局已经落下帷幕,AI的进步才刚刚开始。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB
舒石 希拉 发自 匹村 量子位 报道 | 公众号 QbitAI 德州扑克人机大战,在海南激战正酣(貌似人类又被吊打)。 然而这个受创新工场李开复之邀来到中国的德扑AI冷扑大师,只不过是一个“阿凡达”,
量子位
2018/03/22
6940
深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB
德扑人机大战差点没搞成,这是几个你不知道的细节……
唐旭 发自 海南 量子位 报道 | 公众号 QbitAI “德扑人机大战结束了,人类无悬念被AI吊打。” 这两天看了这么多媒体的新闻稿,大家对这场比赛的印象可能也就仅此而已——但,真的是这样吗? 跟风
量子位
2018/03/30
6770
德扑人机大战差点没搞成,这是几个你不知道的细节……
人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了
今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听…… 报道 | 量子位 舒石 百万美元 年三十儿的黎明来临时,数字定格在106.5万
量子位
2018/01/30
9010
人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了
那个赢了176万美元的德扑AI,马上要来中国掀起人机大战了
转载自 新浪科技 作者 李根 3月24日下午消息,新浪科技今日独家获悉,卡耐基梅隆大学(Carnegie Mellon University,以下简称CMU)开发的德扑人工智能程序Libratus,
量子位
2018/03/22
9250
那个赢了176万美元的德扑AI,马上要来中国掀起人机大战了
AI赌神超进化:德扑六人局击溃世界冠军,诈唬如神,每小时能赢1千刀 | Science
两年前的Libratus,历时20天战胜4位顶级德州扑克选手,但只能1v1。现在全新的赌神Pluribus,终于取得突破,称霸多人局:
量子位
2019/07/17
6680
AI赌神超进化:德扑六人局击溃世界冠军,诈唬如神,每小时能赢1千刀 | Science
AI赌神称霸德扑的秘密,刚刚被《科学》“曝光”了
夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 称霸德州扑克赛场的赌神Libratus,是今年最瞩目的AI明星之一。 刚刚,《科学》最新发布的预印版论文,详细解读了AI赌神背后系统的
量子位
2018/03/22
8270
AI赌神称霸德扑的秘密,刚刚被《科学》“曝光”了
德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软
三年前,Noam Brown从卡内基梅隆大学(CMU)以230页超硬核论文完成答辩,拿下计算机科学博士学位。
量子位
2023/08/05
3330
德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软
45小时德扑人机大战今日开战,冷扑大师多次受信号延迟之困
“如果AlphaGo是超级IQ天才,那么‘冷扑大师’就是超级EQ天才。”李开复如此描述这一场刚刚开场的德扑人机大战。 4月6日至10日,冷扑大师V.S.中国龙之队将在海南展开为期五天、长达45小时的人机扑克对战。 今日的比赛原计划于8点开始,但人类牌手到场后,比赛一直推迟至9点过才正式打响。据悉,比赛推迟是由于现场网络问题,“冷扑大师”期间似乎还经历了重启。比赛过程中,“冷扑大师”也多次困于网络延迟问题,出牌略慢。 今天开始,“冷扑大师”和“龙之队”会进行每天上下午两场共10小时的人机对战。截至发稿,上午的
大数据文摘
2018/05/25
7600
会诈唬、会算计、会打扑克的AI会搞什么事情?
经过五天的鏖战,德州扑克人工智能系统Libratus毫无悬念获得最终胜利。在这场德州扑克人机大战中,中国龙之队的六位牌手共与冷扑大师打了36000手牌,共输792327分,AI完胜人类。 比赛的结局并
机器人网
2018/04/24
8950
会诈唬、会算计、会打扑克的AI会搞什么事情?
NIPS 2017最佳论文出炉:CMU「冷扑大师」不完美信息博弈研究获奖
选自arXiv 机器之心报道 距离 NIPS 2017 开幕还有半月左右,但相关奖项的信息已经开始流出。CMU 教授 Tuomas Sandholm 的个人主页显示,他和其博士生 Noam Brown
机器之心
2018/05/10
9460
AI攻陷多人德扑再登Science,训练成本150美元,每小时赢1000刀
六人无限制玩法是德州扑克最受欢迎的游戏方式,Facebook 与 CMU 的成果是第一个在拥有两个(或以上)人类玩家的比赛中击败人类专业选手的 AI。
机器之心
2019/07/18
1K0
AI攻陷多人德扑再登Science,训练成本150美元,每小时赢1000刀
周末想围观人机德扑大赛?这有10条观(zhuang)战(bi)指南
授权转载自知乎,作者:李天放 “—— AI人机大战已经开战,来自中国的6位顶尖德扑高手对阵“冷扑大师”Libratus, 卡内基梅隆大学研发的无限扑克人工智能系统。点击查看相关推文《45小时德扑人机大战今日开战,冷扑大师多次受信号延迟之困》。 相信不少读者都想在周末观战一下这场人机大赛,尽管这场大赛的结局已颇明朗,在围观的时候还是有不少门道可以学(zhuang)习(bi),如果你跟我一样,同时对AI和德扑都非常感兴趣,来,以下10条观战指南拿好不谢! ——” 关于德扑AI有两个核心问题: "它是如何工作的?
大数据文摘
2018/05/25
5800
独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败
舒石 希拉 发自 CMU 量子位 报道 | 公众号 QbitAI △ Sandholm教授:冷扑大师,来了~ 放下想赢的执念后,AI赌神再没输给人类。 这个AI赌神拉丁名Libratus,中文名冷扑大师。今年1月,它在美国战胜四位顶级人类德扑玩家,赢得176万美元(虚拟货币)。 如今冷扑大师应创新工场李开复的邀请,来到国内,将与6位龙之队高手展开六天鏖战。 为此几天之前,量子位前往美国宾州匹兹堡卡内基梅隆大学(CMU),独家对话Libratus的两位创造者:Tuomas Sandholm教授和他的博士生N
量子位
2018/03/22
8580
独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败
重磅 | 继 AlphaGo 又一突破:人工智能战胜德州扑克职业选手
AI 科技评论消息:当地时间 1 月 30 日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的人工智能系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利。 据官网介绍,此次由四名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,赛程为 20 天,一共进行了 12 万手牌的比赛。 2015 年,CMU 曾组织了首场“大脑对抗人工智能”赛事。在当时的赛事中,代表 CMU 出战
AI科技评论
2018/03/09
6780
重磅 | 继 AlphaGo 又一突破:人工智能战胜德州扑克职业选手
【AlphaGo之后会是什么】一文读懂人工智能打德扑
作者:邓侃 【新智元导读】攻克围棋后,什么是AI的下一个征程?打扑克!相比信息完全可见的围棋,能够猜疑、虚张声势的德扑要困难得多。冷扑大师Libratus是首个在无限手一对一德扑中战胜人类职业玩家的AI,相关论文也在NIPS 2017获得了最佳论文奖。不过,这篇论文不是一般的难!本文中,邓侃博士将从纳什均衡策略、反事实最佳策略等4个方面,生动举例,带你读懂人工智能如何打德扑。 真实的生活,(不会像围棋那样)可以毫无遮拦地洞察整个棋局。真实生活中充斥着虚张声势、欺诈、揣度对方心理。这才是我所研究的博弈。 ——
新智元
2018/03/21
7180
【AlphaGo之后会是什么】一文读懂人工智能打德扑
人工智能德州扑克读懂人心后,下一个挑谁?
CDA数据分析学院的德州扑克比赛才刚刚结束,就听到AI投来的战书。听说最近人工智能又盯上了德州扑克,最近几天的人机大战也是如火如荼。如果说第一天算是2比2打平手,人类选手Daniel Mcaulay赢了AI 4938美元,Jimmy Chou赢了AI 2290美元,Dong Kim输了60,305美元,Jason Les输了21411美元。让我们还在庆幸,也许人工智能还没真正做到读懂人心,但是第二天人工智能目前以四比零取得对人类的压倒性胜利。人类与AI一共激战了6040手牌,四名人类高手全部倒在AI的淫
CDA数据分析师
2018/02/26
5860
人工智能德州扑克读懂人心后,下一个挑谁?
40张图看懂扑克AI对抗人类30年历史,解密冷扑大师前世今生
【新智元导读】2017年是AI在扑克上取得突破的一年,冷扑大师Libratus和DeepStack 相继完胜人类,实现对人类专业级玩家的超越,毫无疑问是里程碑式的突破。在AlphaGo和Master与人类专业棋手的PK光环下,扑克AI的研究稍显黯淡,但是,以解决不完美信息博弈为目标的扑克AI路径难度和重要性并不亚于围棋。在商业谈判、医疗健康、网络安全、拍卖等领域,这一技术有着不容忽视的应用价值。本文以信息图示的形式,为你介绍扑克AI的历史、技术原理、对战细节、AI 的优势等,了解冷扑大师的前世今生。 201
新智元
2018/03/22
1.1K0
40张图看懂扑克AI对抗人类30年历史,解密冷扑大师前世今生
德扑人机大战落幕:冷扑大师79万记分牌优势大胜,赢下200万奖金
唐旭 发自 海南 量子位 报道 | 公众号 QbitAI 今天上午,德扑人机大战最后一场在海南澄迈智力运动产业基地内的智力运动馆结束,“龙之队”以落后47343记分牌、每百手损失15.8大盲的成绩完赛。 这样,为期五天的德扑人机大战也就此落下帷幕,36000手牌打完,“冷扑大师”最终以792327记分牌的优势赢下这次表演赛,赢得200万奖金。 本次比赛分组及个人累计积分榜如下: 第一天比赛结束后,本次比赛的解说嘉宾之一、职业扑克牌手许立达在接受量子位采访时曾表示,他预估最终“龙之队”大概会以
量子位
2018/03/30
7130
德扑人机大战落幕:冷扑大师79万记分牌优势大胜,赢下200万奖金
学界丨CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试
在国外的学术圈里,有一份论文火了。论文里进行的研究表明,人类历史上第一次,AI在德州扑克游戏上赢得了人类职业玩家。而这份论文的突破性意义在于:AI在非完整信息的博弈游戏中,赢得人类职业对手。 这篇论文的名字是《DeepStack:无限下注扑克里的专家级人工智能》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker),1月6号提交到了ArXiv上。 论文作者是来自加拿大Alberta大学、捷克Charles大学、布拉格捷克
AI科技评论
2018/03/09
1.7K0
学界丨CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试
解密!德扑界的AlphaGo:击败顶级德扑玩家的AI赌神Libratus
“AlphaGo退休了,我们还有赌神Libratus。” 今年上半年,AlphaGo多次升级连克人类高手,甚至以3:0一举击败如今世界排名第一的柯洁。而在德州扑克中,人工智能也出现了——Libratus。2017年1月30日,来自CMU的人工智能Libratus战胜了人类顶级德州扑克玩家。然而比赛时,Libratus的创造者并不愿意大肆宣传其运作方式,而这大半年里关于Libratus的信息也鲜有曝光。 直到这个月——在距离NIPS2017开幕还有半个月左右,Libratus的创造者Tuomas Sandho
企鹅号小编
2018/02/11
9740
解密!德扑界的AlphaGo:击败顶级德扑玩家的AI赌神Libratus
推荐阅读
深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB
6940
德扑人机大战差点没搞成,这是几个你不知道的细节……
6770
人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了
9010
那个赢了176万美元的德扑AI,马上要来中国掀起人机大战了
9250
AI赌神超进化:德扑六人局击溃世界冠军,诈唬如神,每小时能赢1千刀 | Science
6680
AI赌神称霸德扑的秘密,刚刚被《科学》“曝光”了
8270
德扑AI之父转投OpenAI!Science封面研究大牛,顶会拿到手软
3330
45小时德扑人机大战今日开战,冷扑大师多次受信号延迟之困
7600
会诈唬、会算计、会打扑克的AI会搞什么事情?
8950
NIPS 2017最佳论文出炉:CMU「冷扑大师」不完美信息博弈研究获奖
9460
AI攻陷多人德扑再登Science,训练成本150美元,每小时赢1000刀
1K0
周末想围观人机德扑大赛?这有10条观(zhuang)战(bi)指南
5800
独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败
8580
重磅 | 继 AlphaGo 又一突破:人工智能战胜德州扑克职业选手
6780
【AlphaGo之后会是什么】一文读懂人工智能打德扑
7180
人工智能德州扑克读懂人心后,下一个挑谁?
5860
40张图看懂扑克AI对抗人类30年历史,解密冷扑大师前世今生
1.1K0
德扑人机大战落幕:冷扑大师79万记分牌优势大胜,赢下200万奖金
7130
学界丨CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试
1.7K0
解密!德扑界的AlphaGo:击败顶级德扑玩家的AI赌神Libratus
9740
相关推荐
深入AI赌神的大脑:运行成本约4.5万/天,存储空间2.6PB
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档