首页
学习
活动
专区
工具
TVP
发布

Coding迪斯尼

专栏成员
322
文章
283556
阅读量
97
订阅数
再造AlphaGo大结局:放飞生猛的BetaGo
我们已经介绍完AlphaGo所需要的设计思想。鉴于算力不足,我们很难通过自己的破电脑跑出一个打败李世石的AlphaGo来,要知道谷歌旗下的DeepMind可是应用了几百块GPU才产生那么生猛的结果。
望月从良
2019-08-13
7390
AlphaGo增强式学习算法:实现‘高手指点’特效
我们在学习过程中离开不了老师的指导,老师除了传授知识外,另外一个很重要的作用是指出问题。我们或多或少有这样的经验,在训练某种技能时一开始进步很快,但不久就进入瓶颈期,这段时期无论你做什么都很难产生明显的突破。此时如果有个水平较高,经验老到的老师给你指条出路,或是告诉你哪一步做出了,你根据它的指导去践行后,水平又会出现新的提升。
望月从良
2019-08-05
4060
增强式学习:如何使用Q-Learning算法训练围棋机器人
本节我们看看如何使用该网络训练围棋机器人。我们在标题中提到Q-Learning,它实际上是一种使用上面网络进行训练的算法流程。首先我们先定义执行Q-Learning算法的机器人对象:
望月从良
2019-07-19
1.2K0
增强式学习:Q-learning算法,将高手的直觉转换为可测量的数值
在任何领域内,高手的一个特点是,它能在一瞬间对局面的好坏有一个比较准确的判断。例如对于围棋高手而言,假设当前棋盘有5处落子位置,像李世石和柯洁这样的高手,他们能在很快的时间内衡量这几个位置的好坏,而且衡量的准确度远比普通棋手高。
望月从良
2019-07-15
5630
实现应用于AlphaGo得增强式学习算法,代码实现2
上一节我们完成了围棋机器人,也就是Agent,它所面临的环境就是当前棋盘状况。Agent有自己的“脑子”,也就是它自己附带着一个经过人类棋手所产生棋盘数据训练后的网络,由于网络采用人类业余高段位的棋手产生的棋盘数据训练,因此它也具备相当水平,现在问题是如何让它像AlphaGo那样具备超过人类能力的落子水平。
望月从良
2019-07-01
3940
实现应用于AlphaGo得增强式学习算法,代码实现1
它将作为工具,用于分析环境,以便帮助Agent做出正确选择。我们将构造一个Agent对象,真正的主角是它,它将执行我们制定的策略算法,然后不断调教网络,让它深入分析环境特性,以便提供准确的数据给Agent做决策。
望月从良
2019-06-20
3280
使用蒙特卡洛树搜索实现围棋落子算法
上一节我们完成了最大最小搜索树,加上alhpa-beta剪枝算法实现了围棋落子走法。它存在一个问题是,树搜索的层次不高,尽管如此,围棋机器人下棋时还是要多次扫描棋盘,进行复杂的运算比较后才能做出决定,这个过程异常耗时,以至于好几分钟都无法运算完。
望月从良
2019-04-28
2.9K0
使用神经网络和深度学习构造围棋智能算法:实现棋盘落子编码
在前面章节中,我们引入不少算法和数据结构用以支持围棋机器人实现。由于围棋的步骤组合太多,几乎没有确定性的算法能在合理的时间内给出好的走法。从本节开始,我们将像AlphGo那样引入深度学习技术,通过训练神经网络的方式打造出一个强大的围棋机器人,使得这个机器人的围棋技能能够超越人类智慧之上。
望月从良
2019-04-28
9520
使用人类棋手棋盘数据训练围棋机器人,实现数据预处理
知己知彼,百战不殆。我们要打造一个能胜过人类的机器人,就必须要让机器人掌握人类的围棋思维模式,因此我们就需要使用人类棋手留下的棋盘数据训练机器人,让它从数据中掌握人类围棋思维存在的模式和套路。
望月从良
2019-04-28
7230
从零开始再造打爆李世石的AlphaGo:创造能下围棋的机器人
我们在上节完成了围棋规则和棋盘状态监测功能,本节我们在基于上节的基础上,设计一个能自己下棋的围棋机器人。首先我们设计一个类叫Agent,它的初始化代码如下:
望月从良
2019-04-09
6870
从零开始再造打爆李世石的AlphaGo:快速构建棋盘和围棋规则
从本节开始,我们废话少说,迅速进入代码编写阶段。对技术而言“做”永远是比“讲”更好的说,很多用语言讲不清楚的道理,看一下代码自然就明白了。我们要实现的围棋机器人必须做到以下几点:
望月从良
2019-03-18
6370
用深度学习实现自然语言处理:word embedding,单词向量化
前几年,腾讯新闻曾发出一片具有爆炸性的文章。并不是文章的内容有什么新奇之处,而是文章的作者与众不同,写文章的不是人,而是网络机器人,或者说是人工智能,是算法通过分析大量财经文章后,学会了人如何编写财经报道,然后根据相关模式,把各种财经数据组织起来,自动化的生成一篇文章,当人阅读时,根本无法意识到文章不是人写,而是电脑生成的。
望月从良
2018-08-16
1.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档