AI科技评论按:计算机博弈也称机器博弈(Computer Games)。如果按英语字面意义来看,这一名词应该理解为「计算机游戏」。 为了更好地对机器博弈进行一个细致、深入的全景式刻画,中国人工智能学会机器博弈专业委员会撰写了《机器博弈白皮书》。 本文要点: 机器博弈的发展状况 机器博弈的复杂度及典型技术 完备机器博弈及非完备机器博弈的专项技术 一、机器博弈的发展状况 在 1928 年,「计算机之父」冯•诺依曼通过对两人零和一类博弈游戏的分析,提出了极大极小值定理 根据不同标准,计算机博弈平台可分为如下几类: 完备信息博弈平台和非完备信息博弈平台 单引擎博弈平台和多引擎博弈平台 单机博弈平台和网络博弈平台 程序级博弈平台和模块级博弈平台 三、完备机器博弈及非完备机器博弈的专项技术 以完备信息机器博弈与非完备信息博弈的专项技术,白皮书以棋类为例,分述了不同棋种的游戏规则,并介绍了它们在机器博弈所采用的主要技术。
机器博弈算法及其应用 Part 1 在游戏理论中的研究工作介绍 分享专家: 中科大信息学院 李厚强教授 内容简介: 机器博弈这个词我们听得多了,可具体来说它究竟是运用在哪里呢? 其实在那些看似简单的游戏里,机器博弈算法正发挥着它的巨大作用。本期中科大信息学院的李厚强教授将向我们展示他的团队对机器博弈算法在游戏理论中的工作。 内容难度:★★☆(计算机专业或有一定计算机知识储备的大学生) ?
代金券、腾讯视频VIP、QQ音乐VIP、QB、公仔等奖励等你来拿!
机器博弈算法及其应用 Part 2 在游戏竞赛及游戏教学结合上的思考 分享专家: 中科大信息学院 李厚强教授 内容简介: 王者荣耀可能大家都或多或少听说过,作为一款国民级游戏其背后是什么样的算法逻辑支撑着它的运行 内容难度:★★☆(计算机专业或有一定计算机知识储备的大学生) ?
如果不说,并不是所有人都能立刻想到,这样一个“小小的”播放器及其背后的视频编解码国际标准,对腾讯公司乃至整个互联网世界意味着什么。 执法机关会把你公司准备运到国外去卖的电视、机顶盒、手机等硬件直接扣住(实际也有不少案例)。 腾讯多媒体实验室的答案是:开源播放器。 “对!就从播放器和解码器开始做起,而且一定要开源!”李翔说。 在标准讨论期间,腾讯多媒体实验室的朱斌博士就开始动手研发基于新一代标准的视频播放器,并且紧紧盯着标准制定会议上的每一个“风吹草动”。 JVET第20次会议上,朱斌博士和同事们向标准组织JVET递交留论文,这款播放器内置了腾讯自研的H.266/VVC软件解码器,支持高清、超高清以及屏幕内容分享等场景的实时解码,开发者们基于此可以快速H.266
威佐夫博弈 威佐夫博弈是一类经典的博弈问题 有两堆石子,两个顶尖聪明的人在玩游戏,每次每个人可以从任意一堆石子中取任意多的石子或者从两堆石子中取同样多的石子,不能取得人输,分析谁会获得胜利 博弈分析 威佐夫博弈不同于Nim游戏与巴什博奕,它的特殊之处在于不能将两堆石子分开分析。 前辈们在对该博弈游戏做了大量的探索之后最终找到了一些非常有意思的性质 下面的内容不想看的可以跳过直接看结论,其实也没啥乱用233,这部分就是为了拓宽视野的 定义先手必输的局势为奇异局势,前几个奇异局势为 必将成为非奇异局势 若同时取走,因为同一个差值只会对应一种奇异局势,必将成为非奇异局势 可以采取适当的方法将非奇异局势变为奇异局势 显然 结论 人们通过对上述性质的探索,同时结合Betty定理,给出了威佐夫博弈的重要结论 怎么样,博弈论是不是很神奇?
博弈论又称对策论或竞赛论,在生活中比较常见,比如两人棋艺对弈、囚徒困境、警察与小偷道高一尺魔高一丈等都是它的典型例子,它是研究具有斗争或竞争性质现象的数学理论和方法,是运筹学的一个重要学科,它有比较鲜明的特点就是参加博弈的双方各自有自己的利益 博弈论本身就是研究在博弈行为中斗争双方是否存在最合理(可以理解为双方损失最少收益最大双赢的结果)的方案,以及如何找到这个合理方案的理论。 ? 描述 博弈问题的特点是会有利益互相冲突的多方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果 局中人 即有权自己做决定且实施行动方案的博弈参加者,通常用I表示局中人集合,局中人至少有两个人 策略集 即在一局博弈中可以供局中人选择的一个实际可行的策略,对于每一个局中人i,策略集为 ,每个局中人的策略至少包含两个策略 局势 在一局博弈中,各个局中人所选定的策略一起构成的策略组称为局势,若有 本文主要解释博弈论中最简单的零和博弈,上述例子中的囚徒困境是典型的非零和博弈,因为两名囚徒可以合作,不是你生我死的激烈对抗型博弈 零和博弈 博弈中有两名局中人,策略集有限,且若双方的赢得是激烈对抗的,一个人赢得了某个值则另一个人就会损失某个值
比如在仓储物流领域,工作效率更为出色的AGV机器人、码垛机器人、分拣机器人,已经在逐渐取代人力,承担起物流运输、配送等工作。 比如率先入场的电商企业,不仅在仓储物流领域推出了码垛机器人、分拣机器人、打包机器人产品,还发布了能够提供物流配送服务的配送机器人。 各有优势 随着物流机器人市场的飞速发展,电商、AI企业在仓储物流领域的交锋正在加剧。而在这场博弈中,各家企业都有自己的优势。 阿里、京东等电商企业的优势,在于其自建的阿里菜鸟网络、京东物流生态。 这种情况下,AI、电商企业谁能在这场博弈中胜出,仍未可知。 谁将胜出? 对于电商、AI企业在国内物流机器人市场的博弈,还需要从行业发展、市场形势等方面综合看待。 而有着多年技术积累极智嘉,其机器人产品则斩获多项年度大奖,其实力也不容小觑。 从这些方面来看,电商、AI企业在国内物流机器人市场,这场难分胜负的博弈,仍将会持续下去。
斐波那契博弈 斐波那契博弈是一种经典的博弈问题 有一堆石子,两个顶尖聪明的人玩游戏,先取者可以取走任意多个,但不能全取完,以后每人取的石子数不能超过上个人的两倍 结论 斐波那契博弈有一个非常重要的性质
解决动态博弈的一个实际要求是确保玩家从任何决策点开始都能玩得很好。为了满足这一需求,现有的工作主要集中在均衡优化上,但现有技术的可扩展性和适用性是有限的。 在本文中,我们提出了一个新的基于强化学习的框架—— 时间诱导自对弈(TISP),它可以从任何决策点开始寻找性能良好的策略。TISP使用信念空间表示、逆向归纳、策略学习和非参数近似。 我们证明了基于TISP的算法可以在有限视界的零和单边随机贝叶斯博弈中找到近似的完美贝叶斯均衡。我们在各种游戏中测试基于TISP的算法,包括有限重复安全游戏和网格世界游戏。
解决方案 博弈类问题的一般解决思路为首先定义fun(status1)为在状态1下先玩者是否能获胜。
除数博弈 爱丽丝和鲍勃一起玩游戏,他们轮流行动,爱丽丝先手开局。 最初,黑板上有一个数字N,在每个玩家的回合,玩家需要执行以下操作: 选出任一x,满足0 < x < N且N % x == 0。 这里引用官方推论:博弈类的问题常常让我们摸不着头脑。当我们没有解题思路的时候,不妨试着写几项试试: N = 1的时候,区间(0, 1)中没有整数是 n的因数,所以此时Alice败。
规定电话号码是以8开头的11位数字。现在给你一串数字,每人可以选择移除一个数字,问最后是否可以构成电话号码
机器之心原创 作者:王子嘉 编辑:Joni Zhong 博弈论和机器学习能擦出怎样的火花?本文作者王子嘉通过回顾总结近年来博弈论和机器学习领域的交叉研究工作,为读者展示了这一领域最新的研究图景。 「博弈论」这个词可能对于一些仅仅致力于机器学习前沿算法的人并不算熟悉。 近年来,随着机器学习的发展,机器学习要应用的场景越来越复杂,开始有人有意识的将博弈论与机器学习联系起来。 基于这三个方面,本文首先解释了博弈论的基本概念及其如何解释机器学习中的一些模型,然后介绍了博弈论在 Multi-Agent Reinforcement Learning(MARL)中的应用,最后介绍了博弈论与机器学习结合所产生的新分支 ——博弈机器学习。
Climbing the Hill Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/...
选自DeepMind 作者:Karl Tuyls、Marc Lanctot、Julian Perolat 机器之心编译 参与:刘晓坤、黄小天、路雪 近日,DeepMind 在 Scientific Report 非对称博弈还可以自然地对现实世界场景建模,例如自动拍卖,其中买家和卖家以不同的动机行动。研究结果给出了对这些场景的新洞察,揭示了一种非常简单的分析方法。 该方法被证明在数学上是很简单的,允许对非对称博弈进行快速、直接的分析。 博弈论是一种数学理论,用于分析竞争环境中决策者使用的策略,可以在多种情景中应用于人类、动物和计算机。 博弈论在研究多智能体环境中很常用,多智能体环境中的系统数量超过一个,例如多个家庭机器人协作打扫房子。 原文链接:https://deepmind.com/blog/game-theory-insights-asymmetric-multi-agent-games/ 本文为机器之心编译,转载请联系本公众号获得授权
选自arXiv 机器之心报道 距离 NIPS 2017 开幕还有半月左右,但相关奖项的信息已经开始流出。 经机器之心求证,获奖论文为《Safe and Nested Subgame Solving for Imperfect-Information Games》。本文将对这篇论文进行简要介绍。 ? 机器之心就最佳论文问题向 Tuomas Sandholm 本人进行求证,并得到了肯定的回复。 据介绍,Liberatus 用了很多蛮力计算来发挥到最佳水平,此外还利用了博弈论。而 CMU NIPS 2017 的这篇获奖论文对其背后的技术做了详细的解读,以下是机器之心对此论文的介绍。 在 2017 年的人机大战中,Libratus 取得里程碑式突破,成为在一对一无限注德扑上战胜人类顶级玩家的首个 AI。
它们被引述如下: “这是过去二十年来机器学习中最酷的想法。”——Yann LeCun,人工智能和深度学习领域的领导者之一 那么博弈论是如何帮助GANs的呢? ? GAN是两个神经网络的组合,即: 生成器 判别器 生成器是生成随机图像的神经网络。另一方面,判别器尝试对生成的图像是属于给定的数据集还是生成的图像进行分类。 ? Libratus的神奇之处在于它不使用任何机器学习方法! 博弈论是Libratus的核心思想。与深度学习或强化学习方法相比,它的计算能力相对较低。 由于现实世界中的案例通常是不完整信息游戏,因此大多数机器学习和深度学习方法在这方面都存在困难。 由于博弈论方法在真实用例中的通用性,它们正逐渐获得发展势头。 我们甚至谈到了博弈论是如何在机器学习领域及其在现实世界中的应用。
选自medium 作者:Elena Nisioti 机器之心编译 参与:Geek AI、刘晓坤 人工智能和博弈论的交集催生了强化学习,但在博弈论基础上的问题求解通常依赖于理性和完美信息假设。 如果训练一个机器人使其能在绳子上保持平衡听起来很困难,那么不妨试试训练一队机器人去赢得一场足球比赛,或者训练一队无人机来监视移动的目标。 博弈论是用于研究拥有共同目标的参与者(player)团队在对弈中的应对策略的最常见方法。它能够赋予我们在这样的环境下指引机器学习算法的工具。 一个在这种情况下的应用实例是:假设我们有一队机器人(参与者),其中的每个机器人(参与者)都必须学会如何做才能有利于它的团队。 一些常用术语 智能体:相当于参与者。 就拿在机器人应用中使用纳什均衡方法的一些障碍来说:想象一下,你现在是机器人世界杯上的一队足球机器人的队长。你的队员和对手有多快、多强、多聪明?对手的队伍会采取什么策略?你该如何奖励你的队员?
选自Science 作者:Noam Brown、Tuomas Sandholm 机器之心编辑部 Libratus 提出了一种在大型状态空间、隐藏信息中有效地应对博弈论推理挑战的方法;它在 12 万手单挑无限注德州扑克比赛中击败了四个顶尖的人类选手 在这些完美信息博弈中,双方都知道博弈中每一个点的确切状态。相反在不完美信息博弈中,关于博弈状态的一些信息是隐藏的,即博弈中存在包含多个决策点的信息集或博弈者无法区分对手的一些行动。 图 1:子博弈求解 上:博弈过程中出现了一个子博弈。 中:通过求解一个增强子博弈,为该子博弈确定一个更加详细的策略,其中每次迭代中的对手持有一个随机牌组,并给出了策略选择,选择旧抽象(红色)的期待值,或选择新的细粒度的抽象(绿色,其中对弈双方的策略都是可变的 https://www.reddit.com/r/MachineLearning/comments/7jn12v/ama_we_are_noam_brown_and_professor_tuomas/ 本文为机器之心编译
那么机器学习能不能挑战隐藏信息更多的游戏,运气程度更大的游戏?从桥牌到麻将,微软已经在非完美信息博弈上做了很多研究,这一个维度还有很多值得探索的问题。 刘铁岩博士表示,在整个游戏 AI 中,有以下数学知识非常重要: 统计学知识:需要对麻将中的大量随机性进行估计与建模; 博弈论知识:需要将打麻将形式化为博弈过程,并将其作为模型设计的指导; 机器学习知识 很多机器学习算法工程师并不太了解博弈论,但做麻将 AI 确实需要一些跨界知识。例如机器学习是一种纯统计的方法,我们看重的是模型平均效果,而博弈论更看重最差的情况,它们两者间的世界观都有一些不同。 其实像 AlphaGo,它几乎是由纯机器学习团队构建的,而冷扑大师的德州扑克团队关注更多的是博弈论。所以对于他们的研究或论文,风格是非常不同的。 因此,对于麻将,我们既无法通过纯机器学习来建模,又无法通过博弈论处理这么复杂的博弈。只有结合两者,才能为 Suphx 提供足够强大的基础。 本文为机器之心原创,转载请联系本公众号获得授权。
腾讯机器翻译(TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
扫码关注云+社区
领取腾讯云代金券