DeepMind AI只需要4个小时的自我训练即可成为国际象棋霸主

图片来自网络

我们在10月份了解到了DeepMind主导的游戏AI 。其新的神经网络不断完善自己去击败了先期优点,在感知方面,为了实现自我训练的成功,人工智能只能局限于明确的规则限制其行为问题,明确的规则决定了游戏的结果。

本周,一篇新的论文详细介绍了DeepMind的AI在这种情况下自我训练的改进速度。现在发展到AlphaZero,这个最新的迭代从头开始,在经过八个小时的自我训练之后击败了人类Go 冠军 。而当AlphaZero转而决定自己教棋,AlphaZero还花了两个小时的时间学习规则知识,仅仅经过四个小时的自我训练。 击败了目前世界冠军的国际象棋程序,

这一切让人非常震惊,DeepMind的最新AI在不到一天的时间里,在三个独立的复杂棋类中成为世界级的竞争对手。这个团队打算在这个时候构建一个以前的软件的“更通用的版本”,看起来他们成功了。

图片来自网络

早在2015年10月,当AlphaGo击败三届欧洲冠军时,它依靠深度神经网络机器学习和搜索技术的新颖组合。在不涉及所有复杂性的情况下,系统观察人类然后通过在称为强化学习的过程中,将AlphaGo的实例相互对抗来磨练其策略。从而AlphaGo可能占主导地位。

这一次,AlphaZero更加依赖强化训练,类似2017年10月AlphaGo Zero的成功。该算法将通过对其自身的第二个实例进行学习。两个Zeroes都会从规则的知识开始,但是他们只能随机移动。然而一旦移动被执行,该算法追踪是否与更好的游戏结果相关联。随着时间的推移,这种知识累计导致更复杂的算法。

我们满满了解,AI建立了以及与他们所玩游戏结果相关的值。它记录了过去某一特定举措的发生频率,因此可以迅速确定一直与成功相关的举措。由于神经网络的两个实例同时在改进,程序确保了AlphaGo Zero总是与当前技能水平以上的挑战对手进行比赛。无论国际象棋多复杂,有可能的位置总计是轻松超过10点100的可能性。

图片来自网络

AlphaGo的成功是如此令人印象深刻,这个壮举是DeepMind最新的一个里程碑,现在包括击败最好的人类棋手,51胜的在线连胜,并且训练自己成为世界级的。正如我们之前提到的,人类几乎没有机会再次击败AlphaGo,但是我们通过观看这个人工智能仍然可以了解本身的意义价值。

欢迎关注科技大侦探

本文来自企鹅号 - 科技大侦探媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【AI比人更擅长妥协】Nature子刊全新机器学习算法探讨人机合作

编辑:闻菲、张乾 【新智元导读】BYU计算机科学教授Jacob Crandall和Michael Goodrich以及麻省理工学院和其他大学的同事创造了一种新算...

3276
来自专栏新智元

AI、大数据和数据科学的10类算法, 以及它们擅长的任务

【新智元导读】AI正在改变我们的职业、我们的工作方式和我们的企业文化。AI让我们得以专注于那些真正关键的技术,让人力资源得以充分发挥他们的长处。但在工作场景中应...

2846
来自专栏新智元

【如何区分“好”和“伟大”】最具价值机器学习技能 Top10

【新智元导读】2017年,哪些机器学习领域的知识技能最具价值?以下内容选自Quora,答主Vladimir Novakovski是Euclid Analytic...

3398
来自专栏人工智能快报

谁将在《权利的游戏》中死去?让人工智能来预测

匈牙利中欧大学(Central European University)的研究人员开发出一种机器学习算法,能预测谁将在电视剧《权利的游戏》中死去。 研究人员量化...

3586
来自专栏灯塔大数据

干货|AI、大数据和数据科学的10类算法, 以及它们擅长的任务

AI正在改变我们的职业、我们的工作方式和我们的企业文化。AI让我们得以专注于那些真正关键的技术,让人力资源得以充分发挥他们的长处。但在工作场景中应用AI确实会...

3378
来自专栏大数据文摘

量子回路终于制成,量子计算机指日可待

1493
来自专栏CDA数据分析师

人工智能与机器学习:两者有何不同?

在过去几年,人工智能和机器学习频繁出现在技术新闻和各种网站上。两者常常被用作同义词,但许多专家认为它们存在微妙且重大的区别。 当然,专家们自己有时对于那些区别到...

2017
来自专栏about云

什么是机器学习技术?

问题导读 1.什么是机器学习? 2.机器学习可以来做什么? 3.机器学习技术可以被应用于哪三种不同方式? 这篇博客文章由微软研究院的杰出科学家J...

27610
来自专栏AI研习社

Video ++孙兆民:人工智能行业报告——视频内容识别行业分析 | 分享总结 | 雷锋网

像素的世界已经延伸到图像之外,虽然视频对于机器学习研究人员来说一直都是个挑战,但现在的技术能够使得从视频中提取信息变得跟从图像中提取信息一样简单。人工智能这个新...

3446
来自专栏PPV课数据科学社区

递归神经网络(RNN)在语义识别方面的应用

背景 数据时代已经到来,当今企业家们已经认识到数据的重要性,并且期望通过数据分析能够驱动增长。企业业务流程面临“计划驱动”转型到”数据驱动“的巨大变革。企业需要...

26911

扫码关注云+社区