首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能如何在扑克中学习‘布拉夫

计算机已成功击败人类在国际象棋和危险中!很快,他们可能会将扑克添加到该列表中。

本月早些时候,一些世界上最好的扑克玩家在匹兹堡里弗斯赌场的单挑无限制德州扑克游戏中面对一个名为Claudico的人工智能(AI)计划。经过两周的比赛和80,000手牌之后,人类玩家赢得了比AI更多的筹码,但还不足以超过需要被认为具有科学有效性的门槛。

科学家们表示,不久之后扑克玩家人工智能会超越人类。

匹兹堡卡内基梅隆大学的计算机科学家托马斯·桑德霍尔姆说:“我猜测[一个玩扑克牌的人工智能]将比一年到五年内世界上最优秀的人类更强大。”他领导创建克劳迪科的团队。桑德霍尔姆表示,即使人工智能能力越来越接近最优秀的人类玩家,也需要更多的扑克牌才能真正宣布该计划取得胜利。

一个AI最知名的成就时,IBM的国际象棋,打深蓝电脑击败了卫冕世界冠军卡斯帕罗夫发生。但与国际象棋不同,扑克是一种信息不完整的游戏; 玩家不了解其他玩家的收益和策略。“扑克与现实世界的关系比国际象棋更为重要,”

扑克冠军董金在与Brains vs. AI扑克比赛中与Claudico正面交锋。

扑克中最重要的策略之一是虚张声势的艺术,其中玩家在没有最好的牌的情况下进行或加注投注,以便欺骗对手进行折叠。“人们经常认为虚张声势是一种心理现象,”桑德霍尔姆说。但除了心理学之外,“虚张声势仍然是一种战略现象,”他说。

桑德霍尔姆和他的同事没有预先计划克劳迪科的扑克策略。他们编写了算法,通过尝试找到纳什均衡来自动计算策略。这种来自博弈论的概念是由美国数学家约翰·纳什(John Nash)开发的,他在电影“美丽的心灵”中被描绘出来。在非合作游戏中,如果考虑到其他玩家的决策,他们在做出最佳决策时会被认为处于纳什均衡状态。

他们说,克劳迪科的扑克能力可能令人印象深刻,但桑德霍尔姆和他的同事并没有开发人工智能只是为了在纸牌游戏中表现出色。使Claudico擅长扑克的能力同样适用于从拍卖到网络安全的所有事情。例如,Sandholm和他的团队开发了一个类似的AI程序,以确定军方应该使用哪些频率和能量进行无线通信,以避免敌人发出信号干扰。

在解决信息不完整的问题时,“扑克是一个很好的基准,”桑德霍尔姆说。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190817A0JFSR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券