前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【NIPS2017最佳论文三分钟视频简介】CMU「冷扑大师」不完美信息博弈研究

【NIPS2017最佳论文三分钟视频简介】CMU「冷扑大师」不完美信息博弈研究

作者头像
WZEARW
发布2018-04-11 15:20:49
5220
发布2018-04-11 15:20:49
举报
文章被收录于专栏:专知专知

【导读】NIPS 2017 开幕还有几天,最佳论文已经公布,CMU教授Tuomas Sandholm 和其博士生 Noam Brown 《Safe and Nested Subgame Solving for Imperfect-Information Games》获得了 NIPS-17 最佳论文。近日Noam Brown发布视频解读论文「冷扑大师」不完美信息博弈研究

▌视频


视频带英文字幕地址:https://v.qq.com/x/page/m0512q8uppm.html

视频内容

▌文章信息


Safe and Nested Subgame Solving for Imperfect-Information Games

论文链接:https://arxiv.org/abs/1705.02955

和完美信息博弈不同,不完美信息博弈不能通过将博弈分解为可独立求解的子博弈而求得占优策略。因此我们越来越多地使用计算密集的均衡判定技术,并且所有的决策必须将博弈的策略当做一个整体。由于不能通过精确的分解来解决不完美信息博弈,人们开始考虑近似解,或通过解决不相交的子博弈提升当前结果。这个过程被称为子博弈求解(subgame solving)。我们提出了一种无论在理论上还是在实践上都超越了之前方法的子博弈求解技术。我们还展示了如何对它们和以前的子博弈求解技术进行调整,以对超出初始行动提取(original action abstraction)的对手的行动做出应答;这远远超越了之前的顶尖方法,即行动转化(action translation)。最后,我们展示了当博弈沿着博弈树向下进行时,子博弈求解可能会重复进行,从而大大降低可利用性。我们应用这些技术开发了能在一对一无限注德州扑克单挑中打败顶尖人类选手的第一个 AI。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 专知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档