在上一篇文章中,我们讨论了在 AI 游戏(主要是五子棋)中,应用 Minimax 算法。在本文中,我们将对该算法进行些改造。虽然它并不适用所有的游戏,但是它可能适用于一般的零和游戏,比如国际象棋,四子棋,跳棋等等...请注意,这些改进中的大部分都是针对特定的游戏。
从国际象棋到中国围棋,人类与“机器”已经较上了劲。 看过那么多场对战,你是不是也想上手体验一把? 来来来,简单五步,手把手教你撸一个缩减版的国际象棋AI。 首先,我们来看一些基础概念: 移动生成 棋面评估 Minimax算法 alpha beta剪枝 在每个步骤中,我们将通过一个国际象棋程序技术来改进算法。我将演示每个步骤是如何影响算法的。 你可以在GitHub上查看AI算法的最终版本。 https://github.com/lhartikk/simple-chess-ai 我无法打败
【导读】本文从Minimax算法开始,一直到最新的 AlphaGo Zero 和 AlphaZero,旨在介绍完全信息博弈上人们一路走来得到的算法,以及背后的思路,还将重点介绍 DeepMind Al
本文来自微软研究院AI头条(MSRAsia),AI 科技评论获授权转载,如需转载请联系微软研究院AI头条。
不仅会下围棋,还自学成才横扫国际象棋和日本将棋的DeepMind AlphaZero,登上了最新一期《科学》杂志封面。
计算机科学家们一直对游戏 AI 乐此不疲,原因并非为了精进棋艺,而是希望在此过程中不断提升人工智能的算法和处理复杂问题的能力。实际上,游戏 AI 的历史几乎和人工智能的历史一样长,很多关于人工智能的研究,都起源于研究如何构建能够完成游戏的智能体(agent)。游戏 AI 的进化,始终与 AI 研究进展相生相伴。
作者:闻菲,刘小芹,常佩琦 【新智元导读】或许“智能爆炸”不会发生,但永远不要低估人工智能的发展。推出最强围棋AI AlphaGo Zero不到50天,DeepMind又一次超越了他们自己,也刷新了世人对人工智能的认知。12月5日,包括David Silver、Demis Hassabis等人在内的DeepMind团队发表论文,提出通用棋类AI AlphaZero,从零开始训练,除了基本规则没有任何其他知识,4小时击败最强国际象棋AI、2小时击败最强将棋AI,8小时击败李世石版AlphaGo,连最强围棋AI
选自int8 Blog 机器之心编译 我们都知道 DeepMind 的围棋程序 AlphaGo,以及它超越人类的强大能力,也经常会听到「蒙特卡洛树搜索」这个概念。事实上,蒙特卡洛树搜索是在完美信息博弈场景中进行决策的一种通用技术,除游戏之外,它还在很多现实世界的应用中有着广阔前景。本文中,我们会以 AlphaGo 为例子,对这一方法进行详细介绍。 长久以来,学术世界一直认为计算机在围棋这个复杂游戏上达到超越人类的水平是几乎无法实现的。它被视为人工智能的「圣杯」——一个我们原本希望在未来十年挑战的遥远里程碑。
2018 区块链技术及应用峰会(BTA)·中国 倒计时 3 天 2018,想要follow最火的区块链技术?你还差一场严谨纯粹的技术交流会——2018区块链技术及应用峰会(BTA)·中国将于2018年3月30-31日登陆北京喜来登长城饭店。追求专业性?你要的这里全都有:当超强嘉宾阵容遇上业界同好的脑洞大联欢,1+1=无限可能,目前门票预购火热进行中。 活动详情: http://dwz.cn/7FI1Ch 编译 | reason_W 出品 | 人工智能头条(公众号ID:AI_Thinker) 长久以来,计算
本文介绍了 AlphaZero 是如何利用深度强化学习解决围棋问题的。首先,AlphaZero 在无任何人类指导的情况下,通过自我对弈的方式学会下围棋。然后,它利用蒙特卡洛树搜索和深度神经网络来评估局面和选择策略。最后,通过与人类世界冠军和之前的围棋 AI 进行比较,AlphaZero 证明了其强大的围棋下棋能力。
AI 科技评论报道:今天 DeepMind 悄悄放出了一篇新论文,介绍了一个「AlphaZero」。一开始我们差点以为 DeepMind 也学会炒冷饭了,毕竟「从零开始学习」的 AlphaGo Zero 论文 10 月就发出来、大家已经讨论了许多遍了。 可定睛一看,这次的 AlphaZero 不是以前那个只会下围棋的人工智能了,它是通用的,国际象棋、日本象棋也会下,所以去掉了名字里表示围棋的「Go」;不仅如此,围棋还下得比上次的 AlphaGo Zero 还要好——柯洁在得知 AlphaGo Zero 之后
国际象棋可以说是最棒的棋盘游戏之一,它是战略战术和纯技术的完美融合。每位玩家开局时各有 16 枚棋子:一王、一后、两车、两马、两象和八兵,各具不同功能与走法。真人对弈可以凭借玩家的经验,步步为营。那么,对于一个机器——计算机,你该如何教会它下棋?近日,有人在 medium 上发表了一篇文章,详细解释了如何教计算机玩国际象棋。
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT对战国际象棋AI,不到15秒就让人大受震撼。 开局ChatGPT执黑,国际象棋AI执白,双方有来有往,ChatGPT甚至主动出击,逼退对方的象(主教): 看起来会是一场激烈较量,直到ChatGPT突然嘎嘣一下,吃掉了自己的象! △奇怪的王车易位操作 事情到这里开始不对劲起来。 无论是棋盘上凭空出现的第9个黑兵(国际象棋黑白各只有8个兵): 还是突然把斜线上的象吃掉的马: △马本来只能走“日”字 简直不把规则放在眼里有木有! 这般
李理,出门问问NLP工程师 编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思。本文来
编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思。本文来自出门问问NLP工程师李理,详细解读了AlphaGo背后的MCTS的工作原理及其对围棋AI的贡献,深度学习包括DCNN在围棋AI领域的发展(包括Facebook darkfmcts),以及二者在AlphaGo系统中的具体协作。文章还结合作者本人的经历对围棋算法与中国象棋算法的差异进行了比较。 本文原标题:AlphaGo的棋局,与人工智能有
关注风云之声 提升思维层次 解读科学,洞察本质 戳穿忽悠,粉碎谣言 导读 AlphaZero下国际象棋的时候,最革命性的一点是,它没有棋子的概念。无论是人类高手还是过去的顶级AI,再怎么也是以棋子实力评估为基础的,被吃了大子会心疼,在这个基础上再去进行“重视中央”之类的局面评估理论。而AlphaZero却完全对棋子没有概念,只要它认为未来整体局势好,弃子根本不叫事。这次Deepmind新论文应该给出结论了,“MCTS+神经网络”就是先进生产力的代表。 2017年12月6号,Deepmind扔出了一篇论文
原文刊载于 明略数据(Minglamp_BigData) 量子位 | QbitAI 已获授权编辑转载 这是7月下旬,马少平老师在明略数据内部做的一个分享,基于此前马老师随笔《人工智能能做什么?》中的一些思考进行了扩展。 📷 AlphaGo的出现,让很多人对人工智能产生了不切合实际的幻想,究竟人工智能能做什么?1个半小时的分享,整理成如下内容,包含以下几个部分: ● 人工智能发展历史 ● 人工智能典型应用 ● 当前行业中人工智能的应用情况 ● 如何指导科研工作 📷 作者:
大神David Silver(AlphoGo architecture,难道没去NIPS?)今天往arxiv上扔了篇文章,Mastering Chess and Shogi by Self-Play
【新智元导读】柯洁誓死战胜 AlphaGo 的豪言壮语言犹在耳, 20 年前第一个被计算机击败的人类冠军、国际象棋大师卡斯帕罗夫却表示,当年和深蓝相遇,既是他的幸运,也是他的诅咒。而20年后的今天,他丝毫不怀疑,每个职业都终将感受到 AI 带来的压力,否则就意味着人类停止发展,而人类劳动逐渐被人类的发明取代,这本身就是文明的历史。 “我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”对于5月23日至27日在中国乌镇与围棋人工智能程序 AlphaGo (阿尔法狗)的对弈,目前世界排名第一的中国职业九段柯洁放
【导读】从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。今天DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索(MCTS)和深度神经网络,和强大的算力,同时在国际象棋,日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的,在训练中除了游戏规则,不提供任何额外的领域知识。
Photo by Jason Kempin/Getty Images for Agon Limited 作者 | 禀临科技联合创始人 PENG Bo 读过AlphaGo Zero论文的同学,可能都惊讶于它的方法的简单。另一方面,深度神经网络,是否能适用于国际象棋这样的与围棋存在诸多差异的棋类? MCTS(蒙特卡洛树搜索)能比得上alpha-beta搜索吗?许多研究者都曾对此表示怀疑。 但今天AlphaZero来了(https://arxiv.org/pdf/1712.01815.pdf),它破除了一切怀
https://blog.csdn.net/NGUever15/article/details/89160951
读过AlphaGo Zero论文的同学,可能都惊讶于它的方法的简单。另一方面,深度神经网络,是否能适用于国际象棋这样的与围棋存在诸多差异的棋类?MCTS(蒙特卡洛树搜索)能比得上alpha-beta搜索吗?许多研究者都曾对此表示怀疑。 但今天AlphaZero来了(https://arxiv.org/pdf/1712.01815.pdf),它破除了一切怀疑,通过使用与AlphaGo Zero一模一样的方法(同样是MCTS+深度网络,实际还做了一些简化),它从零开始训练: 4小时就打败了国际象棋的最强程序St
一个朋友咨询想自己做一个游戏平台,特别提到棋类的完善。在游戏概念发展上,要比目前的游戏平台全面,跟上时代潮流。比如拿国际象棋来说,要引入近几十年国际象棋发展中,产生的新概念。
比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类!
谷歌旗下的deepmind公司又在Science上发表的论文,论文描述了AlphaZero如何快速学习每个游戏,如何从随机对弈开始训练,在没有先验知识、只知道基本规则的情况下,成为史上最强大的棋类人工智能。该论文的初稿去年就挂在网上了,我原来判断这篇文章不会在Nature或者Science上发表,因为创新点实在太小了,这也Science正式出版论文后,并没有掀起多大波澜的原因。
👆点击“博文视点Broadview”,获取更多书讯 📷 强化学习,除了可以用于单个强化学习智能体和环境的相互作用,也可以用于两个或者多个智能体在某个强化学习环境下的博弈。 关于这种类型的算法,最有名的应该是蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)。 随着AlphaGo和AlphaZero算法在围棋、国际象棋和将棋等棋类领域的广泛应用,并且在这些领域内均取得了相比传统的Alpha-Beta 剪枝算法更加优异的性能,蒙特卡洛树搜索算法作为这些智能体使用的算法也被越来越多的人研究
AI科技评论按:腾讯围棋 AI 程序“绝艺”(Fine Art)在世界电脑围棋大赛 UEC 上力压多支日韩参赛退伍获得冠军,一时间又引发了大家对 AI 和围棋的关注和讨论。 其实,自去年 3 月份 AlphaGo 战胜李世石之后,人们对会下围棋的人工智能程序已经不陌生了。大部分人都知道 AlphaGo 是利用了一种名叫深度学习的技术,然后基于互联网棋谱大数据的支持,每天自己跟自己对弈,所以才能这么厉害。 但鲜有人知道的是:在围棋这种逻辑缜密的推理游戏中,AI 究竟是怎么“思考”每一步的落子的?AI 真的清楚
随着人工智能、云计算等技术的兴起,5G 网络的不断成熟,万物互联时代应用需求日益多样化的同时,对于芯片架构的需求也越来越多样化。ARM 架构在提供可靠性能的基础上,以低功耗、低开销的特点被广泛应用到数据中心和云计算领域,并成为必不可少的部分。 在此背景下,腾讯云重磅推出搭载 ARM 架构处理器的新一代 CVM 标准型 SR1,并于即日起正式开启公测。标准型实例 SR1 搭载主频达 2.8GHz 的 Ampere® Altra® 处理器,基于全新优化虚拟化平台,提供了平衡、稳定的计算、内存和网络资源。
人工智能可以说和计算机科学一样古老。早在我们拥有电脑之前,人们就会想到自动推理和智能的可能性。而思考这个问题的伟大思想家之一就是艾伦·图灵。除了图灵测试之外,他对人工智能的贡献,或者说对计算机科学的贡献还包括对任何可以计算(=用数字或其他符号计算)的东西都可以实现自动化的见解。
之前自己编写过一点关于棋类游戏的代码,所以对于这类游戏的大致构成也算是有一些肤浅的认识,前一阵子突然想到应该将这些个零散知识好好总结一番,以算作为自己学习的一点交代。可恨这不总结还好,一总结才发现自己以前自认为通晓的知识原来还是一知半解,更是发现了一堆自己先前遗漏的知识,唉,真可谓学海无涯啊......不过本着学习“八成”原则(这是我前阵子看过的一本书中的观点,感觉还是颇为心有戚戚的,意思大抵是学习过程中不要太过求全求通,慢慢学下去自会变全变通,书名曰《超级学习法》,是本老书了,作者是一名日本的教授,具体姓氏已经不记得了,有兴趣的朋友可以Google看看),自己还是就着多有纰漏的知识储备总结了起来,并且还煞有其事的编写了一些代码,本想借着这篇博文写一写自己总结来的看法,但后来想想与其自己肤浅的在这搬运知识,还不如将自己在学习过程中参考的一些文献介绍给大家,毕竟这原版终归要胜过盗版啊 :)
在2017年,DeepMind推出了AlphaZero,自己学会了掌握国际象棋,日本将棋和Go,击败了世界冠军。DeepMind很高兴看到国际象棋界成员的回应,他们在和AlphaZero对战中看到了一种突破性的,高度动态和非传统的游戏风格,与之前的任何国际象棋游戏程序都不同。
在上篇文章中,我们探讨了如何创造一个能够进行Connect4的对弈大脑。简单的介绍了几种对弈算法,例如极小化极大算法,Alpha-Beta剪枝算法等,最关键的是目前最流行的神经网络算法和深度学习。神经网络算法,让计算机也有一个想人类一样能够思考的大脑,设置独特的场景来进行学习下棋。在本篇文章中,我们将进一步探讨如何让机械臂来实现下棋动作,将想法给实现出来。(换句话说就是,AI机械臂下棋)
最近正在做一个人工智能的中国象棋,所以不可避免的接触到了博弈论,因为考虑到以后还会有所涉及 (alpha-beta search),所以写成了一片文章
阿尔法元(AlphaZero)诞生一周年之际,《科学(Science)》杂志今天以封面文发布了阿尔法元(AlphaZero)经过同行审议的完整论文,Deepmind创始人兼CEO哈萨比斯亲自执笔了这一论文。
Hi,guys.今天我们来介绍一下人工智能下棋,我们将用机械臂来作为对手跟你进行下棋。
点击标题下「大数据文摘」可快捷关注 “深蓝”在1997年的一场历史性的人机大战中战胜了人类国际象棋冠军卡斯帕罗夫。 图/Peter Morgan 1996年,许峰雄博士(右,现为微软亚洲研究院高级研究
只用了不到4小时。 AlphaZero在去年底通过自我对弈,就完爆上一代围棋冠军程序AlphaGo,且没有采用任何的人类经验作训练数据(至少DeepMind坚持这么认为,嗯)。 昨天,GitHub有位大神@Zeta36用Keras造出来了国际象棋版本的AlphaZero,具体操作指南如下。 项目介绍 该项目用到的资源主要有: 去年10月19号DeepMind发表的论文《不靠人类经验知识,也能学会围棋游戏》 基于DeepMind的想法,GitHub用户@mokemokechicken所做的Reversi开发,
选自arXiv 作者:David Silver等 机器之心编译 在 DeepMind 发表 Nature 论文介绍 AlphaGo Zero 之后,这家公司一直在寻求将这种强大算法泛化到其他任务中的可能性。昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 A
本文在腾讯云+社区人工智能专栏首发, 为原创翻译文章. 文章正文部分以引用格式给出原文 导读 英文原文发布于2015年9月, 当时 Google 旗下 DeepMind公司 的 AlphaGo(即 阿尔法围棋)尚未战胜人类的职业围棋选手. 今天, 我们已经知道旧版战胜李世石和柯洁的 AlphaGo(包括后来的 AlphaGoMaster)都以深度学习作为技术基础, 而新版的 AlphaGoZero是在没有人类知识的条件下以神经网络为技术基础自学成才的机器. 本文介绍的下棋机器原理与Alpha Go相似
今天,DeepMind的通用棋类算法,也是迄今最强的棋类AI——AlphaZero,经过同行评议,被顶级期刊 Science 以封面论文的形式,正式引入学界和公众的视野。
2016年1月27日,《自然》刊文报道,谷歌公司开发人工智能程序alpha go(阿尔法围棋)以5:0的战绩完胜欧洲冠军,围棋职业二段樊麾。这是围棋人工智能首次战胜人类职业棋手。这在围棋界掀起了一个不大不小的波澜。之所以不大,是因为樊麾并不能代表人类最高水平。另外当时人们对ALPHA GO知之甚少,仅从棋谱上看,仍有不小的瑕疵。 2016年3月9日至3月15日,ALPHA GO在韩国首尔以4:1的战绩战胜人类顶尖棋手,韩国围棋职业棋手李世石九段。如果说战胜樊麾只是ALPHA GO的小试牛刀,人们对ALPHA
距离IBM的深蓝超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)已经快过去20年了。此后,计算机性能不断提升,但象棋引擎工作仍主要依靠“暴力破解”,通过穷举法,即遍历一切可能的移动方式,走出最好的一步棋。相比计算机,人类所拥有的技巧主要是评估国际象棋的盘面局势,缩小最优棋路的搜索范围。 2015年9月,来自伦敦帝国学院的Matthew Lai开发出一款名为“Giraffe”的人工智能机器,它能通过自学来判断象棋的摆放位置和下步棋该怎么走,它完全颠覆了传统的国际象棋引擎,下棋方法更
感觉才过一个月多,AlphaGo又进一步,推出了AlphaZero。这次除了会下围棋、还会国际象棋和将棋。做到了道德经里说的“一生多”。 据了解,AlphaZero算法可以再8个小时训练击败李世石版本
黑方先行,双方交替下棋。 一步合法的棋步包括: 在一个空格处落下一个棋子,并且翻转对手一个或多个棋子; 新落下的棋子必须落在可夹住对方棋子的位置上,对方被夹住的所有棋子都要翻转过来, 可以是横着夹,竖着夹,或是斜着夹。夹住的位置上必须全部是对手的棋子,不能有空格; 一步棋可以在数个(横向,纵向,对角线)方向上翻棋,任何被夹住的棋子都必须被翻转过来,棋手无权选择不去翻某个棋子。 如果一方没有合法棋步,也就是说不管他下到哪里,都不能至少翻转对手的一个棋子,那他这一轮只能弃权,而由他的对手继续落子直到他有合法棋步可下。 如果一方至少有一步合法棋步可下,他就必须落子,不得弃权。 棋局持续下去,直到棋盘填满或者双方都无合法棋步可下。 如果某一方落子时间超过 1 分钟 或者 连续落子 3 次不合法,则判该方失败。
本文介绍了AlphaZero和AlphaGo Zero的算法实现和进步,指出AlphaZero通过蒙特卡洛树搜索和神经网络实现棋牌游戏的超越,并分析了AlphaGo Zero在围棋、国际象棋和将棋上的表现。同时,文章还探讨了AlphaZero和AlphaGo Zero在落子选择策略上的不同,并预测了AlphaZero在未来可能的发展方向。
距离IBM深蓝(Deep Blue)超级计算机在国际标准锦标赛规则下首次击败国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)已经有差不多20年了. 从那时起, 下象棋计算机的能力变得更加强大, 甚至运行在智能手机上的现代象棋引擎都几乎能让最强的人类毫无招架之力.
这是一个全新的系列--隔三岔五聊算法。这个系列充满不确定性,什么时间更新全靠自己的心情,今天的文章也有能是最后一篇,内容方面会用通俗易懂的方式聊一下自己学过的算法。
领取专属 10元无门槛券
手把手带您无忧上云