首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

【AlphaGo之父David Silver 在线答疑】 Zero能解决围棋史上最难问题

其中,David Silver是DeepMind首席研究员(lead researcher),带领DeepMind强化学习研究小组,也是AlphaGo项目的负责人。...David Silver 1997年毕业于剑桥大学,获得了艾迪生威斯利奖(Addison-Wesley award)。...David Silver:AlphaGo Zero没有使用典型的(model-free的)算法,例如策略梯度或Q-learning,而是使用了一种完全不同的方法。...David Silver:Facebook更侧重监督学习,他们的程序在当时是最强大的之一。我们选择更多地关注强化学习,因为我们认为这最终能带领我们超越人类的知识。...David Silver:我们在过去已经开源了许多代码,但这始终是一个复杂的过程。在AlphaGo情况下,不幸的是,它是一个非常非常复杂的代码库。

1.2K90

现场|David Silver原文演讲:揭秘新版AlphaGo算法、硬件和训练细节

AI科技评论按:乌镇围棋峰会第二天,在《AlphaGo研发介绍,AlphaGo意味着什么》主题演讲上,Demis Hassabis+David Silver针对昨天与柯洁鏖战的AlphaGo研发做了公开介绍...,其中AlphaGo主程序员David Silver在演讲中讲到AlphaGo研发的关键介绍,AI科技评论根据现场原话整理出下文。...主题演讲过后,Demis Hassabis+David Silver接受了AI科技评论在内的多家媒体采访,对一些大家比较感兴趣的地方,这里一并附上: ? 1....来自David Silver先生,AlphaGo首席研究员的声明: 新版本的AlphaGo, 已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色。...- David Silver, lead researcher for AlphaGo

81160

深度 | David Silver全面解读深度强化学习:从基础概念到AlphaGo

在本文中,我要回顾一下 David Silver 的演讲。David Silver 目前任职于 Google DeepMind 团队。...David Silver 的演讲视频可在这里查看:http://techtalks.tv/talks/deep-reinforcement-learning/62360/ 在这个演讲视频中,David...在这个演讲中,David 提供了许多他们自己的实验的实例,最后以对 AlphaGo 的简单讨论结束了演讲。...在这个讲座中,David给出了一张图表明强化学习在不同领域中的复杂地位,如下图所示: ? 尽管我们在机器学习社区中广泛使用强化学习,但强化学习不仅仅是一个人工智能术语。...在解释完前面的东西之后,David Silver 给大家举了一个他们 DeepMind 团队的一个例子:Atari 游戏。他们训练出了一个能够将 Atari 游戏玩的很好的系统。

83580

曾颁给Jeff Dean和David Silver的ACM 计算奖,今年竟然颁给了他.....

Aaronson是德克萨斯大学奥斯汀分校计算机科学系David J. Bruton Jr .百年教授。...1 获奖者介绍 Scott Joel Aaronson,1981年5月21日出生,是美国理论计算机科学家,美国德克萨斯大学奥斯汀分校计算机科学系David J. Bruton Jr .百年教授。...以下列出了往届获奖者名单,其中Sanjeev Arora、Jeff Dean、David Blei和David Silver也曾获得该奖项。...哥伦比亚大学统计与计算机科学系的教授David Blei(博士期间的导师是Michael Jordan)获得了2013年度的该奖项,获奖理由是“对概率主题建模和贝叶斯机器学习的理论和实践做出贡献。”...DeepMind首席研究科学家David Silver获得了2019年度的该奖项,获奖理由是“在计算机游戏方面取得突破性进展。”

37030

David Silver深度强化学习课程「中文字幕」— #共同学习

David Silver 博士是 AlphaGo 的最主要研发人员。众所周知,AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。...在这门强化学习的课程中,Silver 博士从简介、马尔科夫决策过程(Markov Decision Processes)、免模型预测(Model-free Prediction)、免模型控制(Model-free...Silver 博士有一个断言:AI=DL+RL, 就是说深度学习与强化学习的结合,提供了实现强人工智能的途径。...Silver 博士在 University College London 任职后加盟 Deepmind,做出了 AlphaGo 等很有影响的工作。 除了这门课以外,还有一些很好的强化学习资源。...Silver 博士在 2016 年国际机器学习大会 ICML 上做了 Deep Reinforcement Learning 的教程。

1.5K50

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

Alpha Zero的背后核心技术是深度强化学习,为此,专知有幸邀请到叶强博士根据DeepMind AlphaGo的主要研究人员David Silver《深度强化学习》视频公开课进行创作的中文学习笔记,...早在2015年,DeepMind就在youtube上发布了围棋程序master的主要作者David Silver主讲的一套强化学习视频公开课,较为系统、全面地介绍了强化学习的各种思想、实现算法。...本学习笔记力求尽可能还原David Silver的视频演讲,力求用通俗的语言、丰富的示例讲解来深入浅出的解释强化学习中的各种概念算法。...David Silver的这套视频公开课可以在youtube上找到,其链接地址如下:https://www.youtube.com/watch?...序言就写到这里吧,敬请期待David Silver的《强化学习》学习笔记包括以下: 《强化学习》第一讲 简介 《强化学习》第二讲 马尔科夫决策过程 《强化学习》第三讲 动态规划寻找最优策略 《强化学习》

1.1K40

Panuon.UI.Silver使用和介绍

GitHub地址:https://github.com/Panuon/PanuonUI.Silver 码云地址: https://gitee.com/panuon/PanuonUI.Silver 中文学习文档...切换到Visual Studio,右击你的解决方案,点击“添加” -> “现有项目”,定位到刚刚复制的Panuon.UI.Silver文件夹内,选择“Panuon.UI.Silver.csproj”,并点击...在你要使用PanuonUI.Silver的项目下的“引用”条目上右击,并选择“添加引用”。选择“项目”选项卡,勾选“Panuon.UI.Silver”项目,并点击“确定”。...在代码中使用PanuonUI.Silver 要在页面或控件中使用Panuon.UI.Silver,首先要在目标页面中添加命名空间引用。...对于xaml代码,需要添加引用: xmlns:pu="clr-namespace:Panuon.UI.Silver;assembly=Panuon.UI.Silver" 以WindowX为例,添加pu

4.7K30

DeepMind AlphaGo Zero引爆业内,创造者现身Reddit问答

David Silver 视频介绍 AlphaGo Zero 以下为 David Silver 与 Julian Schrittwieser 代表 AlphaGo 创造团队在 Reddit 上的问答:...David Silver:相较于典型的(无模型)算法,如策略梯度或者 Q 学习,AlphaGo Zero 采用了一种相当不同的深度强化学习方法。...David Silver:实际上,表征也很可能在其他选择上表现良好。...David Silver:我们之前已经开源了大量的代码,但过程一直非常复杂。不幸的是,AlphaGo 项目的代码库更加复杂,甚至有点过分。 9....David Silver:创建利用自我对弈来学习的系统在强化学习领域一直是一个开放性问题。我们最初尝试了文章提到的很多类似算法,发现都不稳定。

658100
领券