AI科技评论按:计算机博弈也称机器博弈(Computer Games)。如果按英语字面意义来看,这一名词应该理解为「计算机游戏」。但从事计算机棋牌竞技研究的科学家们,所定义的「Computers Games」则是计算机像人一样会思考和决策的棋类游戏。为了与计算机游戏进行区隔,Computer Games 采用的是「机器博弈」或「计算机博弈」这一具有指代性的译名。 1997 年,IBM 深蓝战胜世界棋王卡斯帕罗夫成为了机器博弈的第一个里程碑,而在近 20 年后,AlphaGo 又横扫了围棋世界冠军李世石,升级
「博弈论」这个词可能对于一些仅仅致力于机器学习前沿算法的人并不算熟悉。其实,有意无意的,博弈论的思想一直存在于很多机器学习的探索过程中,不管是经典的 SVM,还是大火的 GAN,这些模型的背后都有博弈论的影子。
本文整理12册容易被忽略的人工智能书籍,有经典入门内容、有理论加深内容,现在大家都很关注怎样能够更快做出结果,往往忽略了一些基础内容,这些书籍,希望各位“闲暇”时,可以“阅读”一番。
AI 科技评论按:作者Carlos Perez是一名软件开发者,著有《深度学习的设计模型》一书。他在这篇文章中提及了我们熟悉的概念——博弈论,并认为这一概念将会更广泛地应用于机器学习中。 在电影《美丽心灵》中,“如何科学把妹”让我们得以直观地理解约翰·纳什的博弈论,但实际上不完全信息博弈论中的近似纳什均衡也已经出现在一些机器学习的论文中。其中原因何在?雷锋网为读者们编译了他在KDnuggets上的文章,一起来看看吧。 如果你一直是我文章的读者,那么你应该知道,对于许多深度学习的资深从业者来说,新的架构设
选自DeepMind 作者:Karl Tuyls、Marc Lanctot、Julian Perolat 机器之心编译 参与:刘晓坤、黄小天、路雪 近日,DeepMind 在 Scientific Report 上发表论文《Symmetric Decomposition of Asymmetric Games》,表明一个非对称博弈可以分解为多个对称博弈,从而将博弈降维,并且非对称博弈和对称变体的纳什均衡也有非常简单的对应关系。 随着 AI 系统在现实世界中扮演的角色越来越重要,理解不同系统之间如何交互变得非
AI诞生之初,很长一段时间都停留在个体智能阶段,即面向“识别出图像中的内容”、“听懂一段语音”、“预测蛋白质的3D结构”这类目标单一的任务。
人工智能(AI)的研究领域充满了无法回答的问题以及无法被分配给正确问题的答案。在过去,人工智能为它坚持「错误」的做法付出了代价,经历了一段时间的停滞,也就是所谓的「人工智能的寒冬」。然而,人工智能的日历刚刚翻入了春天,相关的应用领域正在蓬勃发展。
我肯定你说对了。对于我们这些早期数学发烧友来说,电影《美丽心灵》(A Beautiful Mind)已经深深地印在了我们的记忆中。Russell Crowe在电影中扮演John Nash,一位诺贝尔经济学奖得主(上图左侧)。
2016 年 3 月,一场机器人与围棋世界冠军、职业九段棋手李世石展开的围棋人机大战受到全球的高度关注。我们知道,最后的结果是 DeepMind 的机器人 AlphaGo 以 4 比 1 的总比分获胜。这是人工智能领域一个里程碑性的事件,也让「博弈」成为一个热门的 AI 研究方向。
选自arXiv 机器之心报道 距离 NIPS 2017 开幕还有半月左右,但相关奖项的信息已经开始流出。CMU 教授 Tuomas Sandholm 的个人主页显示,他和其博士生 Noam Brown
麻将无疑是我国最家喻户晓,老少咸宜的一项棋牌游戏。近年来,随着人工智能在围棋、德州扑克、Dota、星际争霸等众多游戏中获得亮眼的成绩,AI 在麻将领域却一直缺少跨越性的突破。
翻译:刘畅、reason_W 编校:reason_W 编辑:鸽子 今年上半年,继AlphaGo多次升级连克人类高手之后,德州扑克终于也迎来了它的“破壁人”——人工智能Libratus。1月30日,来自CMU的人工智能Libratus战胜了顶级德州扑克玩家。然而比赛时,Libratus的创造者却是对其运作方式遮遮掩掩,这大半年关于Libratus的技术细节也少有曝光。直到这个月——先是在NIPS上取得最佳论文奖,接着15号《Science》杂志就发表其预印版论文,全角度解读Libratus技术细节。而L
机器博弈算法及其应用 Part 1 在游戏理论中的研究工作介绍 分享专家: 中科大信息学院 李厚强教授 内容简介: 机器博弈这个词我们听得多了,可具体来说它究竟是运用在哪里呢?其实在那些看似简单的游戏里,机器博弈算法正发挥着它的巨大作用。本期中科大信息学院的李厚强教授将向我们展示他的团队对机器博弈算法在游戏理论中的工作。 内容难度:★★☆(计算机专业或有一定计算机知识储备的大学生) 以下为精彩视频 ---- 关注更多精彩短视频,点击下方程序小卡片 也可点击“阅读原文”或打开“哔哩哔哩” 搜索关注“
选自Science 作者:Noam Brown、Tuomas Sandholm 机器之心编辑部 Libratus 提出了一种在大型状态空间、隐藏信息中有效地应对博弈论推理挑战的方法;它在 12 万手单挑无限注德州扑克比赛中击败了四个顶尖的人类选手,成功解决了处理不完美信息博弈的领先基准问题与长期存在的挑战。由于现实世界策略交互中的隐藏信息无处不在,因此 Libratus 引入的范式将在 AI 的未来发展和广泛应用中发挥重要作用。 近年来,人工智能已经取得了非常大的进步。很多情况下,这种进步体现在基准游戏中和
当地时间 9 月 21 日,FAIR 研究科学家 Noam Brown 在推特宣布其顺利完成了 CMU 博士论文答辩,并公开了长达 230 页的超硬核博士论文《Equilibrium Finding for Large Adversarial Imperfect-Information Games》以及 101 页的 slides。
选自kdnuggets 作者:Mateusz Wyszyński 机器之心编译 参与:Panda 本文解读了蒙特卡洛树搜索算法背后的概念,并用一个案例说明了欧洲航天局使用该算法来规划星际飞行的方法。 前段时间,我们见证了游戏人工智能领域历史上最重大的事件——AlphaGo 成为了第一个在围棋上战胜世界冠军的计算机程序,其相关论文参阅:https://www.nature.com/articles/nature24270。 DeepMind 的开发者将来自机器学习和树搜索的不同技术结合到一起而实现了这一结果。
这是此前完成的一篇个人觉得非常重要的论文的分析。这篇论文来自 UCL 的Johannes Heinrich 和 David Silver。David Silver 可以说是 AlphaGo 团队的领袖,Johannes 则是 UCL 的博士生,在博弈求解方面的研究取得了一定的进展。本文也是其 15 年论文工作的基础之上的引入深度学习的工作。 博弈论作为一个经典的领域从 1944 年诞生至今也过去了 72 年,该领域得到了巨大的发展,成果累累,对经济学、生物学等等学科产生了重大影响。而计算机科学领域对博弈问
经济学家通过为人类受试者提供选择来套取他们的偏好。该技术广泛应用于产品设计、营销和交互式电子商务系统中。
机器之心专栏 作者:Yatao Bian 腾讯 AI Lab 与瑞士苏黎世联邦理工合作提出基于能量学习的合作博弈新范式,为可解释性等机器学习中的估值问题提供新理论新方法,论文已被 ICLR 2022 接收。 近年来,估值问题在机器学习中变得日益重要。一些典型的估值问题包括用于可解释性的特征归因(feature attribution),用于合作学习的数据估值(data valuation),以及用于集成学习的模型估值(model valuation for ensembles)。开发合理高效的估值算法对于这
夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 称霸德州扑克赛场的赌神Libratus,是今年最瞩目的AI明星之一。 刚刚,《科学》最新发布的预印版论文,详细解读了AI赌神背后系统的
在ICLR 2021(国际表征学习大会)上,Brian McWilliams团队展示的“ EigenGame: PCA as a Nash Equilibrium”获得了杰出论文奖。
机器博弈是人工智能领域的重要分支,它的研究对象多以复杂的棋牌类智力游戏为主,已经得到解决的棋类游戏,几乎全部都应归功于机器博弈近半个世纪的发展。计算机解决问题的优势在于能把不易解析的问题,借助于现代计算机的运算速度优势枚举出所有的合理情形而得解;然而,博弈问题的复杂程度决定了它不能过度依赖机器的计算能力。许多待解决的或已经解决的棋类,其状态空间复杂度或博弈树复杂度量级都太过庞大,所以我们需要添加约束,并且采用合理的算法进行优化。
DeepMind(Google 子公司 )的人工智能 AlphaGo 成功以 4 比 1 的战绩击败冠军级围棋选手李世石,并借此向世人宣告人工智能技术已经攻克围棋项目。那么值得 DeepMind 攻坚的下一项任务又会是什么呢? 伦敦大学学院(University College London)的两位研究员撰写了一篇论文,并在论文中提出了一个值得人工智能技术攻坚的项目:扑克牌。和围棋项目不同,人工智能技术若能在扑克项目上取得胜利,研究人员可以将所赢取的资金作为后续科研经费使用。至少在人类醒悟并决定不再在扑克
今天为大家介绍的是来自Su-In Lee研究团队的一篇关于shapely value特征归因的论文。基于Shapley值的特征归因在解释机器学习模型方面非常流行。然而,从理论和计算的角度来看,它们的估计是复杂的。作者将这种复杂性分解为两个主要因素:去除特征信息的方法和可行的估计策略。这两个因素提供了一个自然的视角使得我们可以更好地理解和比较24种不同的算法。
机器之心原创 参与:李泽南、杜夏德 今天下午 13:37,「中国乌镇·围棋峰会」人机大战的第二场比赛落下帷幕。在耗时 3 小时 7 分钟的比赛后,柯洁投子认负,AlphaGo 取得了胜利。 在 23 日的首轮比赛中,AlphaGo 以四分之一子的优势,击败了世界第一人类围棋手柯洁。赢得比赛后,这场人机大战引起了人们广泛的关注和讨论。DeepMind 也在赛后分析解读了 AlphaGo 背后的技术,表示当前版本 AlphaGo Master 的棋力,较与李世乭对弈的 AlphaGo 版本有三子提升,就连柯洁本
【新智元导读】人工智能在象棋、围棋甚至扑克等“零和”博弈中都已经超越人类,但迄今对机器相互“合作”以取得所有人利益最大化的研究不多。杨百翰大学的这项研究发现 S# 算法能够学会100%合作,有助于自动驾驶、无人机、自动化武器等的研究。 计算机第一次教会它们自己如何在游戏中进行合作,其目的是让所有玩家都能得到最好的结果。研究人员说,这项突破远比训练人工智能在诸如国际象棋或围棋之类双方要么输要么赢的比赛中取胜更加困难。这些进展有助于进一步增进人机合作。 20年前,超级计算机“深蓝”在国际象棋比赛中赢了当时的世
人工智能的关键技术是深度学习,通过模拟人类大脑的神经网络来读取、处理大数据,并找出其中规律,完成特定任务。以深度学习为关键技术的人工智能现已逐渐成为各国研发投入的重点,目前发展已到应用阶段。
本文转载自:腾讯AI实验室 本文第一部分是中国科学技术大学计算机科学与技术学院副教授吴锋带来的主题演讲,第二部分介绍了腾讯AI Lab在AI研究到应用的布局中,在「AI+游戏」方向的挑战与应对的分析。 3月15日,腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗、游戏、多媒体内容、人机交互等四大领域的跨界研究与应用。全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与交流。腾讯AI Lab还宣布了2018三大核心战略,以及同顶级研究与出版机构自然科研的战略合作(点击 这里 查看详情)。
机器之心报道 机器之心编辑部 DeepMind在游戏AI领域又有了新成绩,这次是西洋陆军棋。 在AI游戏领域,人工智能的进展往往通过棋盘游戏进行展现。棋盘游戏可以度量和评估人类和机器如何在受控环境中发展和执行策略。数十年来,提前规划的能力一直是AI在国际象棋、跳棋、将棋和围棋等完美信息游戏以及扑克、苏格兰场等不完美信息游戏中取得成功的关键。 西洋陆军棋(Stratego)已经成为AI研究的下一批前沿领域之一。该游戏的阶段和机制的可视化图如下1a所示。该游戏面临以下两个挑战。 其一,Stratego 的博
近几年,自我博弈中的强化学习已经在围棋、国际象棋等一系列游戏中取得了超人的表现。此外,自我博弈的理想化版本还收敛于纳什均衡。纳什均衡在博弈论中非常著名,该理论是由博弈论创始人,诺贝尔奖获得者约翰 · 纳什提出,即在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单来说,就是人与人之间为了谋取利益竞争。
演讲嘉宾:陈小平 【新智元导读】新智元AI WORLD 2017 世界人工智能大会,中国科技大学教授陈小平教授做了以《机器人灵巧性——人工智能的新挑战》为题的分享。他介绍了以AlphaGo为代表的AI新进展、传统工业机器人的发展、当前智能机器人面临的新挑战和机器人灵巧性技术。提出现有突破重点在于:在确定性问题领域中,智能系统建造的工程可行性得到了显著提升。对于非确定性问题领域,人工智能和机器人仍然存在巨大的理论和工程挑战,机器人灵巧性是解决不确定性领域问题的一条新途径。 日前,波士顿动力发布机器人Atlas
AI 科技评论按:随着 AI 系统在现实生活中变得越来越重要,我们自然该探索不同系统间的交互方式了,这些多智能体间到底用了什么独特的方式呢? 在 DeepMind 的最新论文(发表在 Scientific Reports , Nature 出版社旗下杂志)中,研究人员用了博弈论来阐明这一问题。具体来说,他们研究了两套智能系统在非对称博弈游戏(asymmetric game)中的反应和表现,这些游戏包括 Leduc 扑克和一些图版游戏(如 Scotland Yard)。 在现实生活中,我们会遇到许多类似非对称
原作者 Mirek Stanek 编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权 前言 本月 23 日- 27 日,在乌镇主办“中国乌镇·围棋峰会”中,备受瞩目的要数中国围棋现役第一人、天才少年柯洁与Google AlphaGo(阿尔法狗)人工智能机器人的巅峰对决。AlphaGo与柯洁对弈的三局比赛,分别于 5 月 23 、25、27 日进行。 在 23 日和 25 日的对决中,柯洁虽然发挥神勇,但还是两局均战败。AlphaGo 2-0 领先,已经赢得了三番棋的胜利。 对于人类来说
在前面章节中,我们引入不少算法和数据结构用以支持围棋机器人实现。由于围棋的步骤组合太多,几乎没有确定性的算法能在合理的时间内给出好的走法。从本节开始,我们将像AlphGo那样引入深度学习技术,通过训练神经网络的方式打造出一个强大的围棋机器人,使得这个机器人的围棋技能能够超越人类智慧之上。
📷 上海交通大学计算机系邓小铁教授 文/CSDN焦燕 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的 2017 中国人工智能大会(CCAI 2017)在杭州国际会议中心盛大召开。 在大会的智能金融论坛上,邓小铁教授发表了题为《金融博弈下的价值学习》的分享。 邓小铁现任上海交通大学计算机系致远讲席教授,曾获得清华大学工学学士学位、中国科学院硕士学位以及斯坦福大学博士,曾在英国利
导读:3月18日,微软AI讲堂2019校园行在第一站——中国科学院计算技术研究所启幕,微软亚洲研究院副院长刘铁岩博士为同学们带来了一场精彩的主题演讲,分享如何弥合研究与实际应用的裂隙,从现实中发现机器学习的研究问题,做帮助人们解决现实痛点的机器学习研究。
>搜索策略(Search Strategies)//详细请参见http://blog.csdn.net/racaljk/article/details/18887881
提示:阅读本文预计需要10分钟,读完后希望能够帮助您对人工智能的六大领域有一个基本的全貌认识。 12月7月到12月9日,中国大数据峰会在北京召开,公司帮我弄到了票去参加,其实可以发现“大”数据行业现在一个热门话题就是他们和AI的关系,可见AI现在是多大的一个风口,而且也正如前面第一篇所说的一样,除去一些学术专家外,其实大部分的嘉宾会有意或无意地将AI和机器学习、深度学习划上了等号,这点毫不意外,因为对于媒体而言这个等号是对等的,我觉得基本这样理解也没有大的问题,因为现在大多数人说AI的时候,其实说的就是机器
Root 编译自 DeepMind官方博客 随着人工智能系统在现实世界中扮演越来越重要的角色,理解不同的系统如何相互作用至关重要。 刚刚,DeepMind发表了一篇名为Symmetric Decomp
比特币的共识问题使用了博弈论的研究,这一点有些人知道有些人不知道。但是博弈论到底给比特币这样新诞生的软件带来了什么,可能很多人都不清楚。博弈论的应用和Proof of Work的实施,无疑是非常天才的一个做法。
不久之前,⼈们还常说,计算机的辨别能⼒还不如出⽣不久的婴⼉。在⼈⼯智能(artificial intelligence) 和深度学习(deep learning) 飞速发展的今天,这句话被改写了。
上海交通大学计算机系邓小铁教授 文/CSDN焦燕 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的 2017 中国人工智能大会(CCAI 2017)在杭州国际会议中心盛大召开。 在大会的智能金融论坛上,邓小铁教授发表了题为《金融博弈下的价值学习》的分享。 邓小铁现任上海交通大学计算机系致远讲席教授,曾获得清华大学工学学士学位、中国科学院硕士学位以及斯坦福大学博士,曾在英国利物浦大学、香港城市大学
选自《量子杂志》 作者:Ben Brubaker 机器之心编译 编辑:王楷 滕尚华教授曾两次获得理论计算机科学领域的最高荣誉哥德尔奖,在他的研究中,理论问题和实践问题长期以来一直交织在一起,然而如今他却转头聚焦于一些其他事情。 滕尚华 对于滕尚华而言,理论计算机科学从来都不是纯理论性的。现年 58 岁的滕尚华是南加州大学计算机科学系教授,曾两次获得哥德尔奖,该奖项每年颁发一次,旨在表彰开创性的理论工作。而他的独到之处在于经常潜心于以既实用又有趣的方式将抽象理论与日常生活联系起来。 滕尚华教授于 1964
拿下NIPS2017 最佳论文,登上Science,“冷扑大师”最近有点热。18日,两位作者,CMU博士生Noam Brown和Tuomas Sandholm教授在Reddit上回答问题。对“为什么不使用深度学习”、“AlphaZero会打败Libratus吗”、“不完备信息博弈的下一个大方向” 以及“拿到的奖金如何分配”这些核心问题进行了回答。我们还带来了“冷扑大师”最新《Science》论文的介绍,包含Libratus的三大模块(与Tuomas Sandholm教授11月8日在新智元AI World 2
前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能,如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。
AI 科技评论按,近年来,AI 在博弈游戏中的研究成为研究者们关注的热点之一。2017 年,AlphaGo 成功击败人类最高围棋水平的代表柯洁,一度占据各大媒体的头条。之后,AlphaGo 不断进化,AlphaZero 轻松击败国际象棋和日本将棋并击败业内远超人类冠军水平的顶尖计算机程序。今年,OpenAI Five 击败 DOTA2 世界冠军 OG 团队。
选自IEEE Spectrum 机器之心编译 作者:Evan Ackerman 参与:蒋思源、Smith CMU 和谷歌研究者正在使用基于博弈论和深度学习的对抗性训练策略来提升操作性任务,如抓取物体
一般科研人员在做实验的时候,通常会极力避免机器的这些作弊方式,只有少数的研究人员研究这些案例,他们认为算法的顽皮或许是AI真正走向智能的方式之一。
领取专属 10元无门槛券
手把手带您无忧上云