首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI行业实践精选:扑克,挑战人工智能的最新游戏

AI行业实践精选:扑克,挑战人工智能的最新游戏

作者头像
AI科技大本营
发布2018-04-26 10:42:28
6810
发布2018-04-26 10:42:28
举报

【AI100 导读】短短十年间,人工智能先是战胜了国际象棋大师,然后又击败了韩国的冠军级围棋选手李世石,它的决策系统与学习能力提升的速度令人震惊。那么,人工智能下一个要攻克的领域是什么呢?可能会是扑克。目前,有两个研究团队分别研发出了运行扑克游戏的人工智能程序。在这两款游戏中,电脑都将最聪明的人打败了。

人工智能的发展有一个里程碑,那就是加拿大和捷克共和国的研究人员共同开发的一款扑克机器人,这款机器人在一对一的不限注德州扑克中打败了好几名职业选手。

最有趣的是,项目组的研究人员说他们的程序是使用了一种叫做逼近技术的方法来打败了人类对手,他们将这种技术比作“直觉”。

“如果正确,这的确是人工智能在人机博弈方面的一个重大进步”, Michael Wellman 说。Michael Wellman 是密歇根大学的一名教授,专门从事游戏理论和人工智能方面的研究。“首先,它在一个让人着迷的游戏里面开创了一个重要的里程碑(打败专业扑克选手)。其次,它汇集了一些新颖的想法,这些想法为不完全信息类游戏贡献了一个激动人心的方法。”

本周晚些时候,匹兹堡赌场将会举办一场比赛,几名世界级的扑克比赛选手将在同样版本的扑克游戏中对决卡内基梅隆大学(CMU)开发的一款软件。卡内基梅隆大学带领此研究团队的计算机科学教授 Tuomas Sandholm 说,这些参与对决的人类选手要比之前参与测试的阿尔伯塔研究人员(Alberta researchers)强得多,而20天内进行的120000名选手的对决将为结果带来更大的统计显著性。此次比赛可以证实,这项长期以来对电脑来说似乎过于复杂和微妙的游戏,确实被人工智能掌握了。

这款已经打败了一些职业选手的扑克软件 DeepStack,是由阿尔伯塔大学的计算机科学教授 Michael Bowling 领导的团队开发的。团队成员包含来自查尔斯大学(Charles University)和捷克共和国的捷克理工大学(Czech Technical University)的研究人员。

一篇已经在线上发表但未经同行评议的研究论文声称,DeepStack已经和将近45000名选手进行了扑克对决,并轻松地击败了他们。

扑克比许多其他已经进行过人机对决的游戏更加复杂。引人注目的是,它包含有不同水平的不确定性,比如对手可能只是虚张声势,这在许多实际情况下都很常见,但是人工智能却还没有掌握。扑克玩家看不到对方的手牌,这意味着,相比跳棋、象棋或围棋,扑克游戏并没有将包含的所有信息提供给玩家。

Alphabet的一家英国子公司DeepMind的研究人员因为制造了一个能够打败世界上最强的围棋选手之一的程序,而登上了新闻头条。(见“Google’s AI Masters the Game of Go a Decade Earlier Than Expected”,https://www.technologyreview.com/s/546066/googles-ai-masters-the-game-of-go-a-decade-earlier-than-expected/)。

单挑版不限注德州扑克是一款两人玩的游戏,玩家可以将手上的筹码全部压上去。在很长一段时间内,人们证明这个版本的游戏对机器来说是非常难以玩得专业的。单挑版不限注德州扑克的每一手牌都有10160 (10 后面有160个0)种可能的打法。

DeepStack通过与自己对局学会了玩扑克。每场比赛后,它会复习和改进自己的战略,并得出更优的方法。由于不限注扑克的复杂性,该方法通常包括练习限制更多的扑克版本。DeepStack团队通过应用快速逼近技术来应对这种复杂性,这种技术是通过将以前的扑克对局情况输入到深度学习算法中提炼而来的。

“对于这样一个复杂的游戏来说,真正新鲜的是能够有效地计算在每种情况下应该怎样操作,而不是通过一个简化的游戏可能性分析树来离线工作”,密歇根大学(University of Michigan)的 Wellman 说。

尽管机器评估对手的基础是对手的投注模式,而不是他们的身体语言,研究者还是将DeepStack的逼近技术比作人类玩家的直觉。人类玩家通常靠着直觉判断对手到底是虚张声势还是真的握着一副必胜的手牌。“这种判断方法可以被认为是DeepStack的直觉,”他们写道。“这种直觉可以在任何扑克对决的情况下判断任何人手牌的价值。”

在对决多局之后,我们可以通过观察扑克玩家获胜的局数和他们桌上的赌注来评估玩家的表现。DeepStack的获胜率大约是一名优秀职业玩家超长发挥时获胜率的9倍。

2015年,Bowling 和阿尔伯塔大学的同事们通过开发一款扑克机器人,“攻克”了这种扑克游戏,这款机器人能够完美掌握限制更多的升温版扑克。

匹兹堡比赛中参赛的扑克机器人叫 Libratus。它是由 Sandholm 和他的一个研究生 Noam Brown 共同开发的。这两人尚未披露他们的游戏程序处理该游戏的细节,但 Brown 说,它实质上在试图做到比以前更早地“攻克”这款游戏——或者说弄清楚比赛中所有可能的情境。

Libratus 在匹兹堡超级计算中心( Pittsburgh Supercomputing Center)极其强大的硬件设备上运行,该中心由卡耐基梅隆大学(CMU)和匹兹堡大学(University of Pittsburgh)联合运作。

本文作者 Will Knight 是麻省理工学院技术评论(MIT Technology Review)的AI高级编辑,主要负责的方向是机器智能、机器人和自动化。

本文由 AI100 编译,转载请联系本公众号获得授权


编译:AI100

原文链接:https://www.technologyreview.com/s/603342/poker-is-the-latest-game-to-fold-against-artificial-intelligence/


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档