首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

铁汁,来和AI斗地主!快手开源DouZero技术解读

近日,机器之心报道了快手AI平台部开源斗地主人工智能系统——斗零(DouZero),引起了极大的关注。 团队将传统的蒙特卡罗方法与深度学习相结合,并提出了动作编码机制来应付斗地主复杂的牌型组合。...为了让大家细致了解快手开源斗地主AI,机器之心邀请到了该研究的作者之一、快手AI平台部研究科学家谢静如来做线上分享,为大家做细致解读。...分享主题:DouZero: 首个达到人类水平的开源斗地主AI 嘉宾简介:谢静如,2020年从美国密歇根大学获得物理学博士学位,现在是快手AI平台部Research Scientist,目前主要从事游戏...近日,快手AI平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统DouZero。...相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,论文作者开放了在线演示平台供研究者和斗地主爱好者体验。

97910
您找到你想要的搜索结果了吗?
是的
没有找到

快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?

该算法在不借助任何人类知识的情况下,通过自我博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议 ICML 2021 接收,论文代码也已开源。...为推动后续研究,作者开源斗地主的模拟环境和所有的训练代码。值得一提的是,斗零可以在普通的服务器上训练,并不需要云计算的支持。...作者同时开源了在线演示平台和分析平台,以帮助研究者和斗地主爱好者更好地理解和分析 AI 的出牌行为。...为了让大家细致了解快手开源斗地主AI,机器之心邀请到了该研究的作者之一、快手AI平台部研究科学家谢静如来做线上分享,感兴趣的读者可扫描以下二维码入群。...面向开发者,本次峰会将专门设立开发者专区,并联合 Apache 等各类开源社区,以及多位开源牛人,为开发者们带来脑洞大开的内容分享!

66620

斗地主

[NOIP2015] 斗地主 ★★★☆   输入文件:landlords.in   输出文件:landlords.out 简单对比 时间限制:2 s   内存限制:1025 MB 【题目描述】...牛牛最近迷上了一种叫斗地主的扑克游戏。...斗地主是一种使用黑桃、红心、梅花、方片的A到K加上大小王的共54张牌来进行的扑克牌游戏。...在斗地主中,牌的大小关系根据牌的数码表示如下:3<4<5<6<7<8<9<10<J<Q<K<A<2<小王<大王,而花色并不对牌的大小产生影响。每一局游戏中,一副手牌由n张牌组成。...需要注意的是,本题中游戏者每次可以出手的牌型与一般的斗地主相似而略有不同。 【输入格式】 第一行包含用空格隔开的2个正整数Tn,表示手牌的组数以及每组手牌的张数。

1.5K90

7 Papers & Radios |快手开源斗地主AI,微软提出DyHead、打破COCO记录

,提出了首个从零开始的斗地主人工智能系统——斗零(DouZero)等研究。...但斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战的领域。...近日,快手 AI 平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统——斗零(DouZero)。比较有趣的是,该系统所使用的算法极其简单却非常有效。...该算法在不借助任何人类知识的情况下,通过自我博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议 ICML 2021 接收,论文代码也已开源。...推荐:该研究提出了首个从零开始的斗地主人工智能系统——斗零(DouZero)。

42510

德州农工大学开源RLCard:帮你快速训练会斗地主的智能体

最近德州农工大学数据科学实验室给出了他们的解决方案,开源了基于牌类游戏设计的强化学习 Python 平台 RLCard,其中融合了中西方最流行的几种牌类游戏(包括斗地主、麻将、21 点、德州扑克、UNO...RLCard 是一个用于牌类游戏强化学习研究的开源工具包,其接口简单易用,支持多种牌类环境。...下面给出了用三个随机智能体运行斗地主游戏的示例: ? 开发者还提供了用来更灵活访问游戏树的高级接口。...举个例子,在斗地主中,策略的输入是一个包含 6 个牌平面的矩阵,包括当前的手牌、其他两位玩家的手牌的并集、最近的三个动作、所有已经打出的牌的并集。...举个例子,斗地主就有动作空间组合爆炸的问题,其动作数量超过 3×10^4,其中任意的三张同样的牌、飞机或炸弹都可以带任何一张单牌或对子。

1.5K10

AI喊你斗地主——首个搞定斗地主的深度神经网络

这一次,有人把这种方法用到斗地主游戏的研究中,可以说真的很接地气了! 本论文是 ICLR 2019 的投稿论文,目前该论文还处于双盲审状态,因此也还未公布作者。...和这些棋类相比,中国的纸牌游戏“斗地主”也是非常出名!斗地主属于非完整信息类的游戏即不知对方底牌,在游戏过程中包含隐藏信息,具有随机性,并且多个玩家间存在合作与竞争关系。...本文,我们将介绍一种使用卷积神经网络(CNN)来预测斗地主游戏中玩家行为的方法,它是通过人类的游戏记录来进行监督训练。...迄今为止,还没有使用深度神经网络来研究斗地主游戏的。该网络是否能够在游戏输入信息不完善的情况下选择合理的操作还有待证明。...针对这些问题,我们设计了 DeepRocket,它是目前能够在斗地主游戏中取得最好效果的一种网络。在下面的实验中,我们证明了该网络可以在不完善的信息游戏中学会合作与推理。

5.4K20
领券