AI行业实践精选:扑克,挑战人工智能的最新游戏

【AI100 导读】短短十年间,人工智能先是战胜了国际象棋大师,然后又击败了韩国的冠军级围棋选手李世石,它的决策系统与学习能力提升的速度令人震惊。那么,人工智能下一个要攻克的领域是什么呢?可能会是扑克。目前,有两个研究团队分别研发出了运行扑克游戏的人工智能程序。在这两款游戏中,电脑都将最聪明的人打败了。

人工智能的发展有一个里程碑,那就是加拿大和捷克共和国的研究人员共同开发的一款扑克机器人,这款机器人在一对一的不限注德州扑克中打败了好几名职业选手。

最有趣的是,项目组的研究人员说他们的程序是使用了一种叫做逼近技术的方法来打败了人类对手,他们将这种技术比作“直觉”。

“如果正确,这的确是人工智能在人机博弈方面的一个重大进步”, Michael Wellman 说。Michael Wellman 是密歇根大学的一名教授,专门从事游戏理论和人工智能方面的研究。“首先,它在一个让人着迷的游戏里面开创了一个重要的里程碑(打败专业扑克选手)。其次,它汇集了一些新颖的想法,这些想法为不完全信息类游戏贡献了一个激动人心的方法。”

本周晚些时候,匹兹堡赌场将会举办一场比赛,几名世界级的扑克比赛选手将在同样版本的扑克游戏中对决卡内基梅隆大学(CMU)开发的一款软件。卡内基梅隆大学带领此研究团队的计算机科学教授 Tuomas Sandholm 说,这些参与对决的人类选手要比之前参与测试的阿尔伯塔研究人员(Alberta researchers)强得多,而20天内进行的120000名选手的对决将为结果带来更大的统计显著性。此次比赛可以证实,这项长期以来对电脑来说似乎过于复杂和微妙的游戏,确实被人工智能掌握了。

这款已经打败了一些职业选手的扑克软件 DeepStack,是由阿尔伯塔大学的计算机科学教授 Michael Bowling 领导的团队开发的。团队成员包含来自查尔斯大学(Charles University)和捷克共和国的捷克理工大学(Czech Technical University)的研究人员。

一篇已经在线上发表但未经同行评议的研究论文声称,DeepStack已经和将近45000名选手进行了扑克对决,并轻松地击败了他们。

扑克比许多其他已经进行过人机对决的游戏更加复杂。引人注目的是,它包含有不同水平的不确定性,比如对手可能只是虚张声势,这在许多实际情况下都很常见,但是人工智能却还没有掌握。扑克玩家看不到对方的手牌,这意味着,相比跳棋、象棋或围棋,扑克游戏并没有将包含的所有信息提供给玩家。

Alphabet的一家英国子公司DeepMind的研究人员因为制造了一个能够打败世界上最强的围棋选手之一的程序,而登上了新闻头条。(见“Google’s AI Masters the Game of Go a Decade Earlier Than Expected”,https://www.technologyreview.com/s/546066/googles-ai-masters-the-game-of-go-a-decade-earlier-than-expected/)。

单挑版不限注德州扑克是一款两人玩的游戏,玩家可以将手上的筹码全部压上去。在很长一段时间内,人们证明这个版本的游戏对机器来说是非常难以玩得专业的。单挑版不限注德州扑克的每一手牌都有10160 (10 后面有160个0)种可能的打法。

DeepStack通过与自己对局学会了玩扑克。每场比赛后,它会复习和改进自己的战略,并得出更优的方法。由于不限注扑克的复杂性,该方法通常包括练习限制更多的扑克版本。DeepStack团队通过应用快速逼近技术来应对这种复杂性,这种技术是通过将以前的扑克对局情况输入到深度学习算法中提炼而来的。

“对于这样一个复杂的游戏来说,真正新鲜的是能够有效地计算在每种情况下应该怎样操作,而不是通过一个简化的游戏可能性分析树来离线工作”,密歇根大学(University of Michigan)的 Wellman 说。

尽管机器评估对手的基础是对手的投注模式,而不是他们的身体语言,研究者还是将DeepStack的逼近技术比作人类玩家的直觉。人类玩家通常靠着直觉判断对手到底是虚张声势还是真的握着一副必胜的手牌。“这种判断方法可以被认为是DeepStack的直觉,”他们写道。“这种直觉可以在任何扑克对决的情况下判断任何人手牌的价值。”

在对决多局之后,我们可以通过观察扑克玩家获胜的局数和他们桌上的赌注来评估玩家的表现。DeepStack的获胜率大约是一名优秀职业玩家超长发挥时获胜率的9倍。

2015年,Bowling 和阿尔伯塔大学的同事们通过开发一款扑克机器人,“攻克”了这种扑克游戏,这款机器人能够完美掌握限制更多的升温版扑克。

匹兹堡比赛中参赛的扑克机器人叫 Libratus。它是由 Sandholm 和他的一个研究生 Noam Brown 共同开发的。这两人尚未披露他们的游戏程序处理该游戏的细节,但 Brown 说,它实质上在试图做到比以前更早地“攻克”这款游戏——或者说弄清楚比赛中所有可能的情境。

Libratus 在匹兹堡超级计算中心( Pittsburgh Supercomputing Center)极其强大的硬件设备上运行,该中心由卡耐基梅隆大学(CMU)和匹兹堡大学(University of Pittsburgh)联合运作。

本文作者 Will Knight 是麻省理工学院技术评论(MIT Technology Review)的AI高级编辑,主要负责的方向是机器智能、机器人和自动化。

本文由 AI100 编译,转载请联系本公众号获得授权


编译:AI100

原文链接:https://www.technologyreview.com/s/603342/poker-is-the-latest-game-to-fold-against-artificial-intelligence/


原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-01-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

最强国产围棋AI“凤凰狗”正式开源,单块GPU就能对弈职业九段

由微信翻译团队课余打造,初出茅庐便在福州2018人工智能围棋大赛上击败绝艺夺冠,PhoenixGo备受关注、风头正劲。

1443
来自专栏新智元

【郝克刚】超越图灵测试:AlphaGo最全棋谱欣赏(129盘)

【新智元导读】郝克刚:为了珍惜和反复重温这一庄严吋刻,我搜集到所有能找到的AlphaGo的棋谱,配上我编的围棋欣赏软件,制作了这个"AlphaGo棋局欣赏(全)...

40513
来自专栏量子位

复盘德州扑克人机大战:冷扑大师牌技如何?

问耕 发自 LZYY 量子位 报道 | 公众号 QbitAI 昨天下午,量子位在中关村举办了一个技术沙龙,邀请创新工场AI工程院技术VP李天放、联想智慧医疗CE...

43211
来自专栏新智元

【吴韧】异构神机测试棋胜职业棋手,围棋 AI 中国不落后

? 测试棋现场 新浪体育讯 3月6日,北京望京SOHO极客帮创投会议室,若干年后,这可能会是个值得纪念的日子,因为这个下午,围棋程序“异构神机”第一次与...

3819
来自专栏新智元

三连败! 围棋5高手群殴难敌AIphaGo!田渊栋、颜水成、邓侃解读人机协作与团体对战

【新智元导读】群殴也无济于事!乌镇围棋对抗战,AlphaGo 力克五名围棋高手的团队攻势,再取一胜。人与机器的对战三连败。上午结束的“古力+AlphaGo输给了...

3399
来自专栏AI科技评论

学界|德州扑克算法幕后研发者CMU博士Noam Brown专访:AI如何打败顶级人类牌手?

在上个月举行的单挑无限注德州扑克( heads-up no-limit hold’em)人机对战中,由卡耐基梅隆大学研发的AI程序Libratus以每100手1...

4084
来自专栏企鹅号快讯

2017年AI技术盘点:关键进展与趋势

人工智能最近三年发展如火如荼,学术界、工业界、投资界各方一起发力,硬件、算法与数据共同发展,不仅仅是大型互联网公司,包括大量创业公司以及传统行业的公司都开始涉足...

1995
来自专栏AI科技评论

AlphaGo 将在 2017 年重磅复出,业内人士怎么看?

今日,DeepMind CEO Demis Hassabis 在 Twitter 上发布声明:他们正在全力提高 AlphaGo 的智能程度,全新版 AlphaG...

3466
来自专栏企鹅号快讯

ALPHA ZERO对象棋的启示

2016年1月27日,《自然》刊文报道,谷歌公司开发人工智能程序alpha go(阿尔法围棋)以5:0的战绩完胜欧洲冠军,围棋职业二段樊麾。这是围棋人工智能首次...

2365
来自专栏企鹅号快讯

门罗盘点:2017年那些AI击败人类的瞬间

1997年5月11日在计算机挑战人类的历史上,是被载入史册的一天。当天,IBM的计算机程序“深蓝”在正常时限的国际象棋比赛中,以2.5:3.5的比分击败了当时世...

2385

扫码关注云+社区

领取腾讯云代金券