展开

关键词

从AlphaGo到Libratus,百页白皮书详解(附报告下载地址)

AI科技评论按:计算也称(Computer Games)。如果按英语字面意义来看,这一名词应该理解为「计算游戏」。 为了更好地对进行一个细致、深入的全景式刻画,中国人工智能学会专业委员会撰写了《白皮书》。 本文要点: 的发展状况 的复杂度及典型技术 完备及非完备的专项技术 一、的发展状况 在 1928 年,「计算之父」冯•诺依曼通过对两人零和一类游戏的分析,提出了极大极小值定理 根据不同标准,计算平台可分为如下几类: 完备信息平台和非完备信息平台 单引擎平台和多引擎平台 单平台和网络平台 程序级平台和模块级平台 三、完备及非完备的专项技术 以完备信息与非完备信息的专项技术,白皮书以棋类为例,分述了不同棋种的游戏规则,并介绍了它们在所采用的主要技术。

1.1K80

Wiztalk | 079期 李厚强《算法及其应用—在游戏理论中的研究工作介绍》

算法及其应用 Part 1 在游戏理论中的研究工作介绍 分享专家: 中科大信息学院 李厚强教授 内容简介: 这个词我们听得多了,可具体来说它究竟是运用在哪里呢? 其实在那些看似简单的游戏里,算法正发挥着它的巨大作用。本期中科大信息学院的李厚强教授将向我们展示他的团队对算法在游戏理论中的工作。 内容难度:★★☆(计算专业或有一定计算知识储备的大学生) ?

25420
  • 广告
    关闭

    什么是世界上最好的编程语言?丨云托管征文活动

    代金券、腾讯视频VIP、QQ音乐VIP、QB、公仔等奖励等你来拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Wiztalk | 080期 李厚强《算法及其应用—在游戏竞赛及游戏教学结合上的思考》

    算法及其应用 Part 2 在游戏竞赛及游戏教学结合上的思考 分享专家: 中科大信息学院 李厚强教授 内容简介: 王者荣耀可能大家都或多或少听说过,作为一款国民级游戏其背后是什么样的算法逻辑支撑着它的运行 内容难度:★★☆(计算专业或有一定计算知识储备的大学生) ?

    19020

    一个播放背后的危

    如果不说,并不是所有人都能立刻想到,这样一个“小小的”播放及其背后的视频编解码国际标准,对腾讯公司乃至整个互联网世界意味着什么。 执法关会把你公司准备运到国外去卖的电视、顶盒、手等硬件直接扣住(实际也有不少案例)。 腾讯多媒体实验室的答案是:开源播放。 “对!就从播放和解码开始做起,而且一定要开源!”李翔说。 在标准讨论期间,腾讯多媒体实验室的朱斌士就开始动手研发基于新一代标准的视频播放,并且紧紧盯着标准制定会议上的每一个“风吹草动”。 JVET第20次会议上,朱斌士和同事们向标准组织JVET递交留论文,这款播放内置了腾讯自研的H.266/VVC软件解码,支持高清、超高清以及屏幕内容分享等场景的实时解码,开发者们基于此可以快速H.266

    18910

    论入门之威佐夫

    威佐夫 威佐夫是一类经典的问题 有两堆石子,两个顶尖聪明的人在玩游戏,每次每个人可以从任意一堆石子中取任意多的石子或者从两堆石子中取同样多的石子,不能取得人输,分析谁会获得胜利 分析 威佐夫不同于Nim游戏与巴什奕,它的特殊之处在于不能将两堆石子分开分析。 前辈们在对该游戏做了大量的探索之后最终找到了一些非常有意思的性质 下面的内容不想看的可以跳过直接看结论,其实也没啥乱用233,这部分就是为了拓宽视野的 定义先手必输的局势为奇异局势,前几个奇异局势为 必将成为非奇异局势 若同时取走,因为同一个差值只会对应一种奇异局势,必将成为非奇异局势 可以采取适当的方法将非奇异局势变为奇异局势 显然 结论 人们通过对上述性质的探索,同时结合Betty定理,给出了威佐夫的重要结论 怎么样,论是不是很神奇?

    69940

    浅析论中的零和

    论又称对策论或竞赛论,在生活中比较常见,比如两人棋艺对、囚徒困境、警察与小偷道高一尺魔高一丈等都是它的典型例子,它是研究具有斗争或竞争性质现象的数学理论和方法,是运筹学的一个重要学科,它有比较鲜明的特点就是参加的双方各自有自己的利益 论本身就是研究在行为中斗争双方是否存在最合理(可以理解为双方损失最少收益最大双赢的结果)的方案,以及如何找到这个合理方案的理论。 ? 描述 问题的特点是会有利益互相冲突的多方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果 局中人 即有权自己做决定且实施行动方案的参加者,通常用I表示局中人集合,局中人至少有两个人 策略集 即在一局中可以供局中人选择的一个实际可行的策略,对于每一个局中人i,策略集为 ,每个局中人的策略至少包含两个策略 局势 在一局中,各个局中人所选定的策略一起构成的策略组称为局势,若有 本文主要解释论中最简单的零和,上述例子中的囚徒困境是典型的非零和,因为两名囚徒可以合作,不是你生我死的激烈对抗型 零和 中有两名局中人,策略集有限,且若双方的赢得是激烈对抗的,一个人赢得了某个值则另一个人就会损失某个值

    29120

    电商、AI企业物流人赛道

    比如在仓储物流领域,工作效率更为出色的AGV人、码垛人、分拣人,已经在逐渐取代人力,承担起物流运输、配送等工作。 比如率先入场的电商企业,不仅在仓储物流领域推出了码垛人、分拣人、打包人产品,还发布了能够提供物流配送服务的配送人。 各有优势 随着物流人市场的飞速发展,电商、AI企业在仓储物流领域的交锋正在加剧。而在这场中,各家企业都有自己的优势。 阿里、京东等电商企业的优势,在于其自建的阿里菜鸟网络、京东物流生态。 这种情况下,AI、电商企业谁能在这场中胜出,仍未可知。 谁将胜出? 对于电商、AI企业在国内物流人市场的,还需要从行业发展、市场形势等方面综合看待。 而有着多年技术积累极智嘉,其人产品则斩获多项年度大奖,其实力也不容小觑。 从这些方面来看,电商、AI企业在国内物流人市场,这场难分胜负的,仍将会持续下去。

    18740

    论入门之斐波那契

    斐波那契 斐波那契是一种经典的问题 有一堆石子,两个顶尖聪明的人玩游戏,先取者可以取走任意多个,但不能全取完,以后每人取的石子数不能超过上个人的两倍 结论 斐波那契有一个非常重要的性质

    702150

    贝叶斯的时间诱导自对

    解决动态的一个实际要求是确保玩家从任何决策点开始都能玩得很好。为了满足这一需求,现有的工作主要集中在均衡优化上,但现有技术的可扩展性和适用性是有限的。 在本文中,我们提出了一个新的基于强化学习的框架—— 时间诱导自对(TISP),它可以从任何决策点开始寻找性能良好的策略。TISP使用信念空间表示、逆向归纳、策略学习和非参数近似。 我们证明了基于TISP的算法可以在有限视界的零和单边随贝叶斯中找到近似的完美贝叶斯均衡。我们在各种游戏中测试基于TISP的算法,包括有限重复安全游戏和网格世界游戏。

    12440

    除数

    解决方案 类问题的一般解决思路为首先定义fun(status1)为在状态1下先玩者是否能获胜。

    15630

    除数

    除数 爱丽丝和鲍勃一起玩游戏,他们轮流行动,爱丽丝先手开局。 最初,黑板上有一个数字N,在每个玩家的回合,玩家需要执行以下操作: 选出任一x,满足0 < x < N且N % x == 0。 这里引用官方推论:类的问题常常让我们摸不着头脑。当我们没有解题思路的时候,不妨试着写几项试试: N = 1的时候,区间(0, 1)中没有整数是 n的因数,所以此时Alice败。

    18030

    codeforces 1155B(

    规定电话号码是以8开头的11位数字。现在给你一串数字,每人可以选择移除一个数字,问最后是否可以构成电话号码

    13820

    论遇上学习:一文读懂相关理论

    之心原创 作者:王子嘉 编辑:Joni Zhong 论和学习能擦出怎样的火花?本文作者王子嘉通过回顾总结近年来论和学习领域的交叉研究工作,为读者展示了这一领域最新的研究图景。 「论」这个词可能对于一些仅仅致力于学习前沿算法的人并不算熟悉。 近年来,随着学习的发展,学习要应用的场景越来越复杂,开始有人有意识的将论与学习联系起来。 基于这三个方面,本文首先解释了论的基本概念及其如何解释学习中的一些模型,然后介绍了论在 Multi-Agent Reinforcement Learning(MARL)中的应用,最后介绍了论与学习结合所产生的新分支 ——学习。

    1.1K20

    hdu 4315 Climbing the Hill(阶梯转nim

    Climbing the Hill Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/...

    577110

    前沿 | DeepMind于Nature子刊发文提出非对称的降维方法

    选自DeepMind 作者:Karl Tuyls、Marc Lanctot、Julian Perolat 之心编译 参与:刘晓坤、黄小天、路雪 近日,DeepMind 在 Scientific Report 非对称还可以自然地对现实世界场景建模,例如自动拍卖,其中买家和卖家以不同的动行动。研究结果给出了对这些场景的新洞察,揭示了一种非常简单的分析方法。 该方法被证明在数学上是很简单的,允许对非对称进行快速、直接的分析。 论是一种数学理论,用于分析竞争环境中决策者使用的策略,可以在多种情景中应用于人类、动物和计算论在研究多智能体环境中很常用,多智能体环境中的系统数量超过一个,例如多个家庭人协作打扫房子。 原文链接:https://deepmind.com/blog/game-theory-insights-asymmetric-multi-agent-games/ 本文为之心编译,转载请联系本公众号获得授权

    56170

    NIPS 2017最佳论文出炉:CMU「冷扑大师」不完美信息研究获奖

    选自arXiv 之心报道 距离 NIPS 2017 开幕还有半月左右,但相关奖项的信息已经开始流出。 经之心求证,获奖论文为《Safe and Nested Subgame Solving for Imperfect-Information Games》。本文将对这篇论文进行简要介绍。 ? 之心就最佳论文问题向 Tuomas Sandholm 本人进行求证,并得到了肯定的回复。 据介绍,Liberatus 用了很多蛮力计算来发挥到最佳水平,此外还利用了论。而 CMU NIPS 2017 的这篇获奖论文对其背后的技术做了详细的解读,以下是之心对此论文的介绍。 在 2017 年的人大战中,Libratus 取得里程碑式突破,成为在一对一无限注德扑上战胜人类顶级玩家的首个 AI。

    58380

    AI的论,一份插图教程

    它们被引述如下: “这是过去二十年来学习中最酷的想法。”——Yann LeCun,人工智能和深度学习领域的领导者之一 那么论是如何帮助GANs的呢? ? GAN是两个神经网络的组合,即: 生成 判别 生成是生成随图像的神经网络。另一方面,判别尝试对生成的图像是属于给定的数据集还是生成的图像进行分类。 ? Libratus的神奇之处在于它不使用任何学习方法! 论是Libratus的核心思想。与深度学习或强化学习方法相比,它的计算能力相对较低。 由于现实世界中的案例通常是不完整信息游戏,因此大多数学习和深度学习方法在这方面都存在困难。 由于论方法在真实用例中的通用性,它们正逐渐获得发展势头。 我们甚至谈到了论是如何在学习领域及其在现实世界中的应用。

    44220

    观点 | 理性强化学习遭遇瓶颈,进化算法会成为接替者吗?

    选自medium 作者:Elena Nisioti 之心编译 参与:Geek AI、刘晓坤 人工智能和论的交集催生了强化学习,但在论基础上的问题求解通常依赖于理性和完美信息假设。 如果训练一个人使其能在绳子上保持平衡听起来很困难,那么不妨试试训练一队人去赢得一场足球比赛,或者训练一队无人来监视移动的目标。 论是用于研究拥有共同目标的参与者(player)团队在对中的应对策略的最常见方法。它能够赋予我们在这样的环境下指引学习算法的工具。 一个在这种情况下的应用实例是:假设我们有一队人(参与者),其中的每个人(参与者)都必须学会如何做才能有利于它的团队。 一些常用术语 智能体:相当于参与者。 就拿在人应用中使用纳什均衡方法的一些障碍来说:想象一下,你现在是人世界杯上的一队足球人的队长。你的队员和对手有多快、多强、多聪明?对手的队伍会采取什么策略?你该如何奖励你的队员?

    38300

    学界 | Science论文揭秘:Libratus如何在双人无限注德扑中击败人类顶级选手

    选自Science 作者:Noam Brown、Tuomas Sandholm 之心编辑部 Libratus 提出了一种在大型状态空间、隐藏信息中有效地应对论推理挑战的方法;它在 12 万手单挑无限注德州扑克比赛中击败了四个顶尖的人类选手 在这些完美信息中,双方都知道中每一个点的确切状态。相反在不完美信息中,关于状态的一些信息是隐藏的,即中存在包含多个决策点的信息集或者无法区分对手的一些行动。 图 1:子求解 上:过程中出现了一个子。 中:通过求解一个增强子,为该子确定一个更加详细的策略,其中每次迭代中的对手持有一个随牌组,并给出了策略选择,选择旧抽象(红色)的期待值,或选择新的细粒度的抽象(绿色,其中对双方的策略都是可变的 https://www.reddit.com/r/MachineLearning/comments/7jn12v/ama_we_are_noam_brown_and_professor_tuomas/ 本文为之心编译

    62670

    雀神,微软亚研推出超级麻将AI Suphx,还上了专业十段水平

    那么学习能不能挑战隐藏信息更多的游戏,运气程度更大的游戏?从桥牌到麻将,微软已经在非完美信息上做了很多研究,这一个维度还有很多值得探索的问题。 刘铁岩士表示,在整个游戏 AI 中,有以下数学知识非常重要: 统计学知识:需要对麻将中的大量随性进行估计与建模; 论知识:需要将打麻将形式化为过程,并将其作为模型设计的指导; 学习知识 很多学习算法工程师并不太了解论,但做麻将 AI 确实需要一些跨界知识。例如学习是一种纯统计的方法,我们看重的是模型平均效果,而论更看重最差的情况,它们两者间的世界观都有一些不同。 其实像 AlphaGo,它几乎是由纯学习团队构建的,而冷扑大师的德州扑克团队关注更多的是论。所以对于他们的研究或论文,风格是非常不同的。 因此,对于麻将,我们既无法通过纯学习来建模,又无法通过论处理这么复杂的。只有结合两者,才能为 Suphx 提供足够强大的基础。 本文为之心原创,转载请联系本公众号获得授权。

    41250

    相关产品

    • 机器翻译

      机器翻译

      腾讯机器翻译(TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券