DeepMind AI只需要4个小时的自我训练即可成为国际象棋霸主

图片来自网络

我们在10月份了解到了DeepMind主导的游戏AI 。其新的神经网络不断完善自己去击败了先期优点,在感知方面,为了实现自我训练的成功,人工智能只能局限于明确的规则限制其行为问题,明确的规则决定了游戏的结果。

图片来自网络

本周,一篇新的论文详细介绍了DeepMind的AI在这种情况下自我训练的改进速度。现在发展到AlphaZero,这个最新的迭代从头开始,在经过八个小时的自我训练之后击败了人类Go 冠军 。而当AlphaZero转而决定自己教棋,AlphaZero还花了两个小时的时间学习规则知识,仅仅经过四个小时的自我训练。 击败了目前世界冠军的国际象棋程序,

这一切让人非常震惊,DeepMind的最新AI在不到一天的时间里,在三个独立的复杂棋类中成为世界级的竞争对手。这个团队打算在这个时候构建一个以前的软件的“更通用的版本”,看起来他们成功了。

图片来自网络

早在2015年10月,当AlphaGo击败三届欧洲冠军时,它依靠深度神经网络机器学习和搜索技术的新颖组合。在不涉及所有复杂性的情况下,系统观察人类然后通过在称为强化学习的过程中,将AlphaGo的实例相互对抗来磨练其策略。从而AlphaGo可能占主导地位。

这一次,AlphaZero更加依赖强化训练,类似2017年10月AlphaGo Zero的成功。该算法将通过对其自身的第二个实例进行学习。两个Zeroes都会从规则的知识开始,但是他们只能随机移动。然而一旦移动被执行,该算法追踪是否与更好的游戏结果相关联。随着时间的推移,这种知识累计导致更复杂的算法。

我们满满了解,AI建立了以及与他们所玩游戏结果相关的值。它记录了过去某一特定举措的发生频率,因此可以迅速确定一直与成功相关的举措。由于神经网络的两个实例同时在改进,程序确保了AlphaGo Zero总是与当前技能水平以上的挑战对手进行比赛。无论国际象棋多复杂,有可能的位置总计是轻松超过10点100的可能性。

图片来自网络

AlphaGo的成功是如此令人印象深刻,这个壮举是DeepMind最新的一个里程碑,现在包括击败最好的人类棋手,51胜的在线连胜,并且训练自己成为世界级的。正如我们之前提到的,人类几乎没有机会再次击败AlphaGo,但是我们通过观看这个人工智能仍然可以了解本身的意义价值。

本文来自企鹅号 - 全球大搜罗媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

这个AI“魔镜”能测试你的性格,并号称要把结果告知你老板 | 墨尔本大学最新研究

童话故事中的“魔镜”能给你的颜值评分,而墨尔本大学的研究人员近来设计了一种AI“魔镜”,运用人工智能根据人们的面部特征来分析他们的性格。

902
来自专栏腾讯高校合作

【犀牛鸟论道】社会传播学的若干课题与实践

社会传播学的若干课题与实践 贺鹏、易玲玲、高瀚、陈川 腾讯微信数据中心社会传播组 [摘要]俗话说“酒香不怕巷子深”,表面上说的是酒香引人,实际上是指好酒在街坊邻...

3205
来自专栏UAI人工智能

译 Michael Nielsen 之问——是否有关于智能的一个简单的算法?

867
来自专栏悦思悦读

什么是数据科学

本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【1】部分。 分享主题:Data Science学习分享会 分享时间:2016年4月18日晚8:00-...

36415
来自专栏新智元

【让AI学习更像人】贝叶斯的觉醒:不确定性、高斯过程的重要性

【新智元导读】 深度学习火热的背后,也带来了对神经网络自身能力的质疑,特别是被人诟病的“黑箱”问题。本文介绍了一些通过不同于深度学习的路径实现 AI 的公司,强...

2574
来自专栏前沿科技

中兴智能视觉大数据:客流统计引进人脸识别技术太强大了

中兴智能视觉大数据报道:近年来,随着客流统计领域技术的成熟和需求增加,不断会有新的技术出来。人脸识别客流分析技术,作为一种新颖的客流量统计分析手段,利用人脸图像...

2313
来自专栏新智元

Science:用机器学习发现贫穷,准确率高达99%

要解决世界上的问题,必须知道问题发生在哪里。因此,联合国要解决世界贫困问题,追踪非洲的贫困情况就非常重要。然而,实地搜集数据可能很危险,而且效率缓慢、成本高。但...

40310
来自专栏灯塔大数据

干货 :数据驱动决策的13种思维

“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上! 第一、信度与效度思维 这部分也许是全文最难理解的部分,但我觉得也...

3486
来自专栏新智元

颠覆自动驾驶的AI相机来了!光速执行深度学习

如今,自动驾驶汽车和无人驾驶飞机背后的图像识别技术依赖于人工智能:计算机本质上学会了自己识别物体,比如识别狗、过马路的行人或停车的汽车。主要问题是,目前运行人工...

1032
来自专栏PPV课数据科学社区

这套烧脑的数学模型,教你如何预测一个互联网产品的未来

这套模型是我在运营路况电台 2000 万用户过程中积累出来的,也是我们团队做产品迭代,运营和产品目标设定最基本的方法。这个产品模型从几个相对不同的维度定义一个产...

3557

扫码关注云+社区