首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

AlphaGo:黑色方碑?

AlphaGo的胜利是否意味着人工智能的黑色方碑(图1, 请参见电影《2001:太空漫游》)已经出现? 本文将从AlphaGo的原理入手逐步探讨这个问题。 ?...AlphaGo从大量人类经验中学到了大量的相关性的规律(概率函数),但是确没有学习到任何的因果性规律。这应该是AlphaGo和人类棋手最本质的区别了。 3.AlphaGo超越了人类的智能了吗?   ...从这个意义上来说,AlphaGo在围棋上超越人类智能应该还没有实现。 4.AlphaGo会故意输给李世石吗?   ...而且AlphaGo也能够不段的学习新的经验,神之一手可能战胜AlphaGo一次,但下一次就不见得有机会了。AlphaGo就如同练就了针对棋力的吸星大法,人类对他的挑战只会越来约困难。...这就使得AlphaGo的方法面对这些问题,可能是完全无法解决的。 7.AlphaGo到底意味着什么?

847100

浅读AlphaGo zero

然后就可以进行下棋,并成功打败他的哥哥AlphaGo Lee和AlphaGo Fan. 相关数据: 训练了3天,进行了4.9百万次对弈。 0.4s计算每次的落子。...二、训练过程中所需要的信息 AlphaGo Zero在其训练程序中明确或隐含地使用的领域知识或其蒙特卡罗树搜索; 这些是需要替代的知识项目AlphaGo Zero学习不同的(交替马尔科夫)博弈: 1、完善的围棋规则信息...如果AlphaGo Zero的根值和最佳子值低于阈值,则会退出。...与AlphaGo Fan和AlphaGo Lee的MCTS相比,主要区别在于AlphaGo Zero不使用任何推出;它使用单个神经网络代替单独的策略和价值网络;叶节点总是扩展,而不是使用动态扩展;每个搜索线程只是等待神经网络评估...在AlphaGo Zero的大型(40块,40天)实例中也使用了转置表。

98470

LeCun:不要夸大AlphaGo

现在你能看到所有AI的本领——自动驾驶汽车也好,医学影像中的落地也罢,即使是AlphaGo在围棋比赛中拿到世界第一——这些都是非常窄层面上的智能,是在某些可以大量收集数据情况中为了特定功能专门训练的。...我不是想将DeepMind在AlphaGo上的研究影响往小了说,而认为是人们将AlphaGo的发展解读为机器智力发展的重要过程是不妥的。这两者完全不是一回事。...问: DeepMind在AlphaGo中创造的算法也可以应用到其他科学研究中,比如蛋白质折叠和药物研究。你认为在其他地方应用这种研究容易吗? LeCun: AlphaGo中用的是增强学习。...AlphaGo Zero在几天内下了数百万盘围棋,可能比人类在发明围棋以来的大师下得还要多。

67360

投资版AlphaGo系统探讨

AlphaGo战胜人类围棋顶尖高手之际,本文简单探讨了投资AlphaGo系统模块与训练数据以及可行性。并将其实现逻辑与郝伯特•西蒙过程理性算法比较。...虽然现在AlphaGo系统做的还是人类算法的模拟仿真。 但想想也不用太担心,围棋的规则是固定的,但金融的规则可不是固定的。...还好我们还有杀手锏,如熔断机制,很轻松就可以碾压AlphaGo系统,让其做的所有训练无效。另外如何界定数据边界,信息收集成本等问题,都可以让我们不用太担心投资版AlphaGo系统。...最后,我们来探讨如何更好的使用AlphaGo系统为人类服务。李喆六段在评价李世石两盘棋说:“AlphaGo给出选点的思维方式与人类不同,但我们却可以用人类的方式去理解它,这是一件多么美妙的事情。”...AlphaGo的分析[OL].知乎 专栏文章.2016-02-29. [7] 袁峻峰.

48040

UAI AlphaGo 系列—— AlphaGo 的确是一个大事件

为了庆祝 5 月 23 日 AlphaGo 中国赛,UAI 推荐一篇有趣且有深度的思考文章。...为了解释其工作机制,我们先描述 AlphaGo 系统,主要内容参见 AlphaGo 团队发表于今年一月份的 论文(系统的细节和 AlphaGo 与李世石的比赛有不同,但是主要的原理是一致的)。...为了超越业余水平,AlphaGo 需要一种衡量棋盘状态的方法。...(实际上,AlphaGo 使用了一个更加复杂的实现方式)接着,AlphaGo 将这个观点和对很多可能的走子过程的搜索进行组合,将搜索放在策略网络认为更加可能的路径上。...然后,策略网络帮助 AlphaGo 构建了一个刻画了非常类似于人类棋手所谓的关于不同棋盘状态的直觉的概念。 按照这样的方式,AlphaGo 比 Deep Blue 更具突破性。

42440

【业界】你也能与AlphaGo谈笑风生了, AlphaGo教学工具上线

同时每步棋AlphaGo都会给出自己的胜率分析,希望AlphaGo对围棋的独特理解可以给我们一些启发。...2.所有盘面都有AlphaGo评价的胜率,以及AlphaGo推荐的下法。 3.所有AlphaGo的胜率与推荐下法,AlphaGo都思考将近10分钟(1000万次模拟)。...▌AlphaGoAlphaGo zero、AlphaZero ---- 2016年Google在Nature上发表基于深度学习算法的围棋程序AlphaGoAlphaGo在古老的围棋比赛中以4:1的高分击败了世界大师级冠军李世石...AlphaGo Lee、仅用40天就击败 AlphaGo Master的围棋人工智能。...从无知幼儿开始,我们新的程序—AlphaGo Zero达到了超级专家的水平,在与之前开发的AlphaGo(指代和李世石对弈的AlphaGo)的对弈中,取得了100-0的完胜。

77740

读《Nature》论文,看AlphaGo养成

这篇文章主要是阅读《Nature》论文及关于AlphaGo的相关文章的学习心得。 本文的主要目的是增进分享,交流学习,方便初学者了解AlphaGo中的算法,以及一些机器学习中的常见思路。...如下图就是《Nature》论文中的樊麾与AlphaGo对弈的一个棋谱: ? 对弈从开局到中局变化都很大,尤其是中局,往往是一着不慎,满盘皆输。用数学的描述叫做估值函数(得分函数)非常不平滑。...在AlphaGo的论文中就是采用了以下更多的特征: ? 所以,输入模型的特征是一个361×n维度的向量。基于这些向量来训练模型。...最终,AlphaGo只依靠一个13层的卷积神经网络就能训练出一个比较好的落子分类器。比起图像识别竞赛用到的20、30层的深层神经网络还是比较浅了。这些都是特征工程的功劳。...◆ ◆ ◆ 总结 到此为止,AlphaGo的算法原理基本介绍完了。其实也并不复杂,而且这些都不是AlphaGo或者DeepMind团队首创的。

64430

AlphaGo单挑五虎将获胜,连笑配对AlphaGo笑到最后

上午 10:59 分,连笑八段联手 AlphaGo 执白战胜古力九段与 AlphaGo 的组合,赢得了史上首次人机配对赛。...而在下午 16::32 时,五位世界冠军组成的团队在与 AlphaGo 的对决中收官阶段认输,团体赛告于段落。 ? 前所未有的人机赛制 今天 AlphaGo 与人类展开了两场比赛。...在配对赛中,由「古力九段+AlphaGo」对战「连笑八段+AlphaGo」。比赛中,人类棋手除了要理解 AlphaGo 的风格,还要与之合作。...行至 200 手,全场占据优势的黑棋一方出现了分歧,AlphaGo 的代表举出了认输的牌子,但遭到了古力的拒绝,比赛继续(据古力介绍,AlphaGo 认输,人类有权拒绝,但如果人类选手认输,AlphaGo...获胜方连笑在接受采访时称开局与 AlphaGo 配合有点困难,把队友带入了一条不归路,自己的队友不如对方的 AlphaGo 稳健,感觉很像人类。 ? ?

66190

谷歌AI教父:AlphaGo有直觉

当谷歌的AlphaGo战胜了人类顶级棋手,人工智能开始更多进入大众视野。本次峰会主题为原力.感知,探寻商业发展和技术发展的内在原动力,感知VR、AR、人工智能和智能出行等领域的未来。...当谷歌的AlphaGo战胜了人类顶级棋手,人工智能开始更多进入大众视野。无论是其深度应用还是可能存在的隐患,都是大家讨论的话题。 即使是在科技大佬之间,观点也存在截然相反的情况。...他更是透露,AlphaGo拥有了直觉。 辛顿早在1970年代初期就开始从事人工智能科研工作,是名副其实的AI先驱。...谈谷歌的人工智能,AlphaGo有了直觉 海伊: 现在您在学术界和应用界之间架起了桥梁,在您工作了多伦多大学任教的同时也加入了谷歌。...辛顿: AlphaGo很有意思的事情是,它拥有一种普通计算机所没有的东西,那就是直觉:观察棋盘,然后选择一个正确的地方落子。为什么选择这里?因为感觉这里对。

53650

AlphaGo的大数据等技术分析

AlphaGo的分析 最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。 AlphaGo这个系统主要由几个部分组成: 1....我们的DarkForest和AlphaGo同样是用4搭建的系统。...有意思的是在AlphaGo为了速度上的考虑,只用了宽度为192的网络,而并没有使用最好的宽度为384的网络(见图2(a)),所以要是GPU更快一点(或者更多一点),AlphaGo肯定是会变得更强的。...AlphaGo的估值网络可以说是锦上添花的部分,从Fig 2(b)和Extended Table 7来看,没有它AlphaGo也不会变得太弱,至少还是会在7d-8d的水平。...他们能做出AlphaGo并享有现在的荣誉,是实至名归的。 从以上分析也可以看出,与之前的围棋系统相比,AlphaGo较少依赖围棋的领域知识,但还远未达到通用系统的程度。

85380

AlphaGo的算法等技术分析

最近我仔细看了下AlphaGo在《自然》杂志上发表的文章,写一些分析给大家分享。...我们的DarkForest和AlphaGo同样是用4搭建的系统。...有意思的是在AlphaGo为了速度上的考虑,只用了宽度为192的网络,而并没有使用最好的宽度为384的网络(见图2(a)),所以要是GPU更快一点(或者更多一点),AlphaGo肯定是会变得更强的。...3、估值网络 AlphaGo的估值网络可以说是锦上添花的部分,从Fig 2(b)和Extended Table 7来看,没有它AlphaGo也不会变得太弱,至少还是会在7d-8d的水平。...他们能做出AlphaGo并享有现在的荣誉,是实至名归的。 从以上分析也可以看出,与之前的围棋系统相比,AlphaGo较少依赖围棋的领域知识,但还远未达到通用系统的程度。

1.3K80

专栏 | AlphaGo Zero:笔记与伪代码

关于 AlphaGoAlphaGo Zero 的介绍参阅 DeepMind 的官方博客:https://deepmind.com/research/alphago/ 和 https://deepmind.com...2 伪代码 我们提供了一个用于训练 AlphaGo Zero 的简要的概念性的伪代码,有助于你更轻松地理解 AlphaGo Zero 的原理;参见后文算法 1。...与 AlphaGo 相比,AlphaGo Zero 的特性有: 1. 它是从随机对弈学习的,使用了自我对弈强化学习,没有使用人类数据或监督; 2....AlphaGo Zero 不仅是一种启发式搜索算法。...因此,我们不能直接将 AlphaGo 算法应用到这些应用上。 另一方面,AlphaGo 算法,尤其是其底层的技术(即深度学习、强化学习和蒙特卡洛树搜索),则有很多应用。

1.3K70
领券