从国际象棋到中国围棋,人类与“机器”已经较上了劲。 看过那么多场对战,你是不是也想上手体验一把? 来来来,简单五步,手把手教你撸一个缩减版的国际象棋AI。 首先,我们来看一些基础概念: 移动生成 棋面评估 Minimax算法 alpha beta剪枝 在每个步骤中,我们将通过一个国际象棋程序技术来改进算法。我将演示每个步骤是如何影响算法的。 你可以在GitHub上查看AI算法的最终版本。 https://github.com/lhartikk/simple-chess-ai 我无法打败
在上一篇文章中,我们讨论了在 AI 游戏(主要是五子棋)中,应用 Minimax 算法。在本文中,我们将对该算法进行些改造。虽然它并不适用所有的游戏,但是它可能适用于一般的零和游戏,比如国际象棋,四子棋,跳棋等等...请注意,这些改进中的大部分都是针对特定的游戏。
【导读】本文从Minimax算法开始,一直到最新的 AlphaGo Zero 和 AlphaZero,旨在介绍完全信息博弈上人们一路走来得到的算法,以及背后的思路,还将重点介绍 DeepMind Al
本文来自微软研究院AI头条(MSRAsia),AI 科技评论获授权转载,如需转载请联系微软研究院AI头条。
计算机科学家们一直对游戏 AI 乐此不疲,原因并非为了精进棋艺,而是希望在此过程中不断提升人工智能的算法和处理复杂问题的能力。实际上,游戏 AI 的历史几乎和人工智能的历史一样长,很多关于人工智能的研究,都起源于研究如何构建能够完成游戏的智能体(agent)。游戏 AI 的进化,始终与 AI 研究进展相生相伴。
作者:闻菲,刘小芹,常佩琦 【新智元导读】或许“智能爆炸”不会发生,但永远不要低估人工智能的发展。推出最强围棋AI AlphaGo Zero不到50天,DeepMind又一次超越了他们自己,也刷新了世人对人工智能的认知。12月5日,包括David Silver、Demis Hassabis等人在内的DeepMind团队发表论文,提出通用棋类AI AlphaZero,从零开始训练,除了基本规则没有任何其他知识,4小时击败最强国际象棋AI、2小时击败最强将棋AI,8小时击败李世石版AlphaGo,连最强围棋AI
在本节中,我们将研究一个经典的AI问题:游戏。为了清晰起见,我们将重点关注的最简单的场景是双人游戏,如井字棋和国际象棋等完全信息游戏。
不仅会下围棋,还自学成才横扫国际象棋和日本将棋的DeepMind AlphaZero,登上了最新一期《科学》杂志封面。
李理,出门问问NLP工程师 编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思。本文来
编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思。本文来自出门问问NLP工程师李理,详细解读了AlphaGo背后的MCTS的工作原理及其对围棋AI的贡献,深度学习包括DCNN在围棋AI领域的发展(包括Facebook darkfmcts),以及二者在AlphaGo系统中的具体协作。文章还结合作者本人的经历对围棋算法与中国象棋算法的差异进行了比较。 本文原标题:AlphaGo的棋局,与人工智能有
今天,DeepMind的通用棋类算法,也是迄今最强的棋类AI——AlphaZero,经过同行评议,被顶级期刊 Science 以封面论文的形式,正式引入学界和公众的视野。
选自arXiv 作者:David Silver等 机器之心编译 在 DeepMind 发表 Nature 论文介绍 AlphaGo Zero 之后,这家公司一直在寻求将这种强大算法泛化到其他任务中的可能性。昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 A
此前不久,DeepMind 还推出了 AlphaFold,成功地根据基因序列预测出蛋白质的 3D 形状,将人工智能技术应用在了科学研究领域。
在2017年,DeepMind推出了AlphaZero,自己学会了掌握国际象棋,日本将棋和Go,击败了世界冠军。DeepMind很高兴看到国际象棋界成员的回应,他们在和AlphaZero对战中看到了一种突破性的,高度动态和非传统的游戏风格,与之前的任何国际象棋游戏程序都不同。
关注风云之声 提升思维层次 解读科学,洞察本质 戳穿忽悠,粉碎谣言 导读 AlphaZero下国际象棋的时候,最革命性的一点是,它没有棋子的概念。无论是人类高手还是过去的顶级AI,再怎么也是以棋子实力评估为基础的,被吃了大子会心疼,在这个基础上再去进行“重视中央”之类的局面评估理论。而AlphaZero却完全对棋子没有概念,只要它认为未来整体局势好,弃子根本不叫事。这次Deepmind新论文应该给出结论了,“MCTS+神经网络”就是先进生产力的代表。 2017年12月6号,Deepmind扔出了一篇论文
【导读】从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。今天DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索(MCTS)和深度神经网络,和强大的算力,同时在国际象棋,日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的,在训练中除了游戏规则,不提供任何额外的领域知识。
选自 Medium 机器之心编译 参与:路雪、 刘晓坤 近日,Jose Camacho Collados 在 Medium 上发表了一篇题为《Is AlphaZero really a scienti
可以说,AI的发展进化史就是AI在游戏领域的升级史。 SciShow是Youtube上热门的科普向脱口秀节目。它的内容包罗万象,无论什么问题在这里都会得到风趣又详尽的解答。在本次节目中,介绍了AI 是
本文介绍了DeepMind在AI领域的最新成果——AlphaZero,它可以在一天内自主学会下国际象棋、将棋和围棋,且超越了所有旧版AI。AlphaZero通过蒙特卡洛树搜索和强化学习,在每种游戏中挖掘数千万种走法,迅速成为专家。尽管AlphaZero在3种游戏中表现卓越,但离真正的人类智能还有很长的路要走。
大数据文摘作品 作者:姜范波、Aileen、Yawei Xia、龙牧雪、魏子敏 距离阿尔法狗元版本刷屏一个多月时间,阿尔法狗又进化了,这次不光可以玩围棋,不再是“狗”了。我一点也不惊讶。 在用阿尔法狗(AlphaGo)和阿尔法狗元(AlphaGo Zero)称霸围棋世界后,当地时间周二晚,DeepMind的研究组宣布已经开发出一个更为广泛的阿尔法元(AlphaZero)系统,它可以训练自己在棋盘,将棋和其他规则化游戏中实现“超人”技能,所有这些都在一天之内完成,并且无需其他干预,战绩斐然: 4个小时成为了世
本文介绍了DeepMind在围棋、国际象棋和将棋三个棋类上实现超人智能的AlphaZero程序,该程序在一天内自学成才,并在8小时内击败了之前最强的围棋程序AlphaGo Zero。AlphaZero使用了80个TPU和12个CPU,训练了70万步,并在30分钟内完成了对围棋、国际象棋和将棋的自学。AlphaZero通过蒙特卡洛树搜索和强化学习来评估游戏状态,并尝试不同的策略以找到最佳动作。尽管AlphaZero在三种游戏中表现出色,但它仅关注棋类游戏,而不涉及其他领域,并且目前还无法像人类那样在多种领域灵活运用。AlphaZero在人工智能领域取得了重要突破,但仍需进一步研究以解决其局限性。"
DeepMind的使命是证明AI不仅可以精通游戏,甚至可以在不知道规则的情况下做到这一点,最新的MuZero就实现了这一目标。
阿尔法元(AlphaZero)诞生一周年之际,《科学(Science)》杂志今天以封面文发布了阿尔法元(AlphaZero)经过同行审议的完整论文,Deepmind创始人兼CEO哈萨比斯亲自执笔了这一论文。
今年,Deepmind的“AlphaGo”在围棋领域的胜利让不少人了解到人工智能的强大。当时有人还认为没有人类棋手的经验,人工智能很难快速达到如今的成绩,但后来推出的AlphaGo Zero却是从0开始,自己学习围棋,又取得超越AlphaGo的成绩。如今Deepmind再次将这种强大的算法泛化,提出了AlphaZero:一种可以从零开始,在多种不同的任务中通过自我对弈,达到超越人类水平的新算法。这种算法可以通过24小时的对弈训练后,就可以在日本将棋和国际象棋领域击败目前业内顶尖的计算机程序(这些程序早就战胜
本文将简单介绍这些算法的演进历程。未来,DeepMind 能否创造出这一系列的终极算法 OmegaZero 呢?
大数据文摘出品 作者:Caleb 10月初的一场国际象棋比赛,让19岁的Hans Niemann一跃成名。 相信大家都还记得,这场比赛也让Niemann直接打破了多年位居世界第一Magnus Carlsen在此之前创下了53场“西部不败”的记录。 是的,在所有人看来,这本来是一场没有任何悬念的比赛。 随后,大家都开始怀疑Niemann在比赛中作弊。 毕竟这也不是他第一次了。Niemann也亲口承认了曾在两次比赛中有过作弊行为,他解释说,这是因为他十分想与顶级棋手比赛,于是将作弊视为一条捷径,这是“他一
MuZero 算法在国际象棋、日本将棋、围棋和雅达利(Atari)游戏训练中的评估结果。横坐标表示训练步骤数量,纵坐标表示 Elo评分。黄色线代表 AlphaZero(在雅达利游戏中代表人类表现),蓝色线代表 MuZero。
点击标题下「大数据文摘」可快捷关注 “深蓝”在1997年的一场历史性的人机大战中战胜了人类国际象棋冠军卡斯帕罗夫。 图/Peter Morgan 1996年,许峰雄博士(右,现为微软亚洲研究院高级研究
20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。
国际象棋可以说是最棒的棋盘游戏之一,它是战略战术和纯技术的完美融合。每位玩家开局时各有 16 枚棋子:一王、一后、两车、两马、两象和八兵,各具不同功能与走法。真人对弈可以凭借玩家的经验,步步为营。那么,对于一个机器——计算机,你该如何教会它下棋?近日,有人在 medium 上发表了一篇文章,详细解释了如何教计算机玩国际象棋。
本文介绍了 AlphaZero 是如何利用深度强化学习解决围棋问题的。首先,AlphaZero 在无任何人类指导的情况下,通过自我对弈的方式学会下围棋。然后,它利用蒙特卡洛树搜索和深度神经网络来评估局面和选择策略。最后,通过与人类世界冠军和之前的围棋 AI 进行比较,AlphaZero 证明了其强大的围棋下棋能力。
AI 科技评论报道:今天 DeepMind 悄悄放出了一篇新论文,介绍了一个「AlphaZero」。一开始我们差点以为 DeepMind 也学会炒冷饭了,毕竟「从零开始学习」的 AlphaGo Zero 论文 10 月就发出来、大家已经讨论了许多遍了。 可定睛一看,这次的 AlphaZero 不是以前那个只会下围棋的人工智能了,它是通用的,国际象棋、日本象棋也会下,所以去掉了名字里表示围棋的「Go」;不仅如此,围棋还下得比上次的 AlphaGo Zero 还要好——柯洁在得知 AlphaGo Zero 之后
MuZero成为DeepMind最先进的AI算法。(图片来源:DeepMind公司网站)
感觉才过一个月多,AlphaGo又进一步,推出了AlphaZero。这次除了会下围棋、还会国际象棋和将棋。做到了道德经里说的“一生多”。 据了解,AlphaZero算法可以再8个小时训练击败李世石版本
近日,DeepMind一篇关于MuZero的论文“Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model”在Nature发表。与AlphaZero相比,MuZero多了玩Atari的功能,这一突破进展引起科研人员的广泛关注。
之前自己编写过一点关于棋类游戏的代码,所以对于这类游戏的大致构成也算是有一些肤浅的认识,前一阵子突然想到应该将这些个零散知识好好总结一番,以算作为自己学习的一点交代。可恨这不总结还好,一总结才发现自己以前自认为通晓的知识原来还是一知半解,更是发现了一堆自己先前遗漏的知识,唉,真可谓学海无涯啊......不过本着学习“八成”原则(这是我前阵子看过的一本书中的观点,感觉还是颇为心有戚戚的,意思大抵是学习过程中不要太过求全求通,慢慢学下去自会变全变通,书名曰《超级学习法》,是本老书了,作者是一名日本的教授,具体姓氏已经不记得了,有兴趣的朋友可以Google看看),自己还是就着多有纰漏的知识储备总结了起来,并且还煞有其事的编写了一些代码,本想借着这篇博文写一写自己总结来的看法,但后来想想与其自己肤浅的在这搬运知识,还不如将自己在学习过程中参考的一些文献介绍给大家,毕竟这原版终归要胜过盗版啊 :)
本文介绍了AlphaZero和AlphaGo Zero的算法实现和进步,指出AlphaZero通过蒙特卡洛树搜索和神经网络实现棋牌游戏的超越,并分析了AlphaGo Zero在围棋、国际象棋和将棋上的表现。同时,文章还探讨了AlphaZero和AlphaGo Zero在落子选择策略上的不同,并预测了AlphaZero在未来可能的发展方向。
阅读本文前,请您先点击右上角的蓝色字体“优课屋”,再点击“关注”,这样您就可以继续订阅文章了!
【导读】12月11日晚,大家期待已有的 AlphaGo教学工具正式上线了,DeepMind资深研究员黄士杰和DeepMind围棋大使樊麾在Facebook和其新浪微博差不多同一时间发布一条重要消息,谷
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 有一个棋力很好的朋友,总是下不赢怎么办? 英国程序员小哥詹姆斯想出奇招:把电脑连在鞋垫上。 比赛现场,詹姆斯(左)看起来像是聚精会神地在思考下一步动作,他的对手也没发现哪里不对劲。 但在桌面之下,他正努力用脚底板和树莓派电脑沟通。 在没有显示器也不能发出声音的情况下,输入要靠鞋里安装的压力传感器,输出则靠振动马达。 成功赢下一盘后,詹姆斯坦白自己其实是「用脚」赢的。 他的朋友欧文一开始还不信,直到他把身上的设备都掏出来,欧文才露出一副见了鬼的表情。
Chapter 1.2 A Brief History of Artificial Intelligence and Games
关于作者:Fled在新加坡国立大学获得博士学位,现就职于腾讯游戏AI研究中心。 本文内容包含以下章节: Chapter 1.2 A Brief History of Artificial Intelligence and Games 本书英文版: Artificial Intelligence and Games - A Springer Textbook 从历史来看,在很长的时间里,创造一个可以代替人类玩游戏的机器人是唯一的在游戏中应用人工智能的方式。而在人工智能发展的早期,绝大部分游戏AI的研究
作 者 苏博览,腾讯互动娱乐高级研究员 原文首发于知乎专栏 - 第九艺术魅影 商业转载请联系腾讯WeTest获得授权,非商业转载请注明出处。 WeTest 导读 从历史来看,在很长的时间里,创造一个可以代替人类玩游戏的机器人是唯一的在游戏中应用人工智能的方式。而在人工智能发展的早期,绝大部分游戏AI的研究者都在努力做出一个很牛的AI在棋类游戏中战胜人类。这里面一部分的原因是,棋类游戏蕴含着一些人类智能的基本因素。 大部分的棋类游戏的规则都很简单,但是在方寸的棋盘之内,七百年来无数的人类天才都期望找到最优的
谷歌旗下人工智能公司DeepMind将围棋AI转战国际象棋和日本将棋领域——无须人类智慧加持,已胜券在握。 AlphaZero是由谷歌旗下DeepMind研发的通用棋类AI,以不到四小时的自学击败了世界最强的国际象棋程序。 重新改进的人工智能程序AlphaZero曾多次击败世界顶级围棋选手,并扩大到学习其他棋类项目。它从零开始学习国际象棋,仅用4小时,就在100盘比赛中击败了世界顶级国际象棋程序 Stockfish 8。 据在康奈尔大学图书馆的arXiv上发表的一篇未经同行评审的研究论文称,在这100场
距离IBM深蓝(Deep Blue)超级计算机在国际标准锦标赛规则下首次击败国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)已经有差不多20年了. 从那时起, 下象棋计算机的能力变得更加强大, 甚至运行在智能手机上的现代象棋引擎都几乎能让最强的人类毫无招架之力.
之前我写过篇博文,用象棋的思维趣说IT人的职业发展和钱途,发现象棋中的一些思维能应用到我们程序员平时的职业发展中。
距离IBM的深蓝超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)已经快过去20年了。此后,计算机性能不断提升,但象棋引擎工作仍主要依靠“暴力破解”,通过穷举法,即遍历一切可能的移动方式,走出最好的一步棋。相比计算机,人类所拥有的技巧主要是评估国际象棋的盘面局势,缩小最优棋路的搜索范围。 2015年9月,来自伦敦帝国学院的Matthew Lai开发出一款名为“Giraffe”的人工智能机器,它能通过自学来判断象棋的摆放位置和下步棋该怎么走,它完全颠覆了传统的国际象棋引擎,下棋方法更
人工智能发展的早期,绝大部分游戏AI的研究者都在努力做出一个很牛的AI在棋类游戏中战胜人类。这里面一部分的原因是,棋类游戏蕴含着一些人类智能的基本因素。
如果你已经在从事其中一种设计体验工作,你可能会想:“信息架构不是关于创建站点地图、线框图和网站导航菜单的吗?”确实如此——这些是信息架构设计的重要元素。但是信息架构不只是如此。
领取专属 10元无门槛券
手把手带您无忧上云