【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【导读】亚马逊人工智能部门机器学习专家AlexanderZai最新撰写的深度强化学习实战书籍(预计2018年秋季出版)《Deep Reinforcement Learning in Action》介绍使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。手把手教你构建深度强化学习项目,比如控制模拟机器人,自动化股票市场交易,甚至建造一个可以玩围棋的机器人。随书同时提供代码,可以让你动手测试改进。

▌图书介绍



人类从反馈中不断学习得最优——对于积极的结果我们会被鼓励去采取行动,但是对于消极结果我们被阻止采取行动。这种强化过程可以应用于计算机程序,使它们能够解决经典编程无法解决的更复杂的问题。《Deep Reinforcement Learning in Action》这本书会向您介绍深度强化学习的基本概念和术语,以及将其实施到您自己的项目中所需的实用技能和技巧。

关于该技术

深度强化学习是机器学习的一种形式,其中人工智能体从自身的原始感官输入中学习最优行为。系统感知环境,解释其过去决策的结果,并利用这些信息来优化其行为,以获得最大的长期回报。深度强化学习这一技术为AlphaGo的成功做出了杰出贡献,但它所能做的并不仅仅局限于这些!更多令人兴奋的应用程序等待被发现。让我们开始吧。

关于该书

《Deep Reinforcement Learning in Action》将会教你如何根据环境的直接反馈对智能体进行编程和学习。您将使用流行的PyTorch深度学习框架来构建网络,以探索从深度Q网络到策略梯度方法,再到进化算法的一系列强化学习算法。当您完成学习的时候,您就可以把你所学的知识应用到实际的项目中,比如控制模拟机器人,自动化股票市场交易,甚至构建一个可以玩围棋的机器人。

书中介绍了什么

  • 将问题结构化为马尔可夫决策过程
  • 常用的算法,如深度Q网络,策略梯度方法
  • 进化算法和驱动它们的直觉知识
  • 将强化学习算法应用于实际问题

关于读者

读者将需要具备中级Python的技能和对深度学习有基本的理解。

关于作者

亚历山大•扎伊(Alexander Zai)是亚马逊人工智能公司(Amazon AI)的一名机器学习工程师,致力于MXNet,为一系列AWS机器学习产品提供支持。他还是Codesmith的联合创始人,Codesmith是一家软件工程训练营,在洛杉矶和纽约设有分部。布兰登•布朗(Brandon Brown)是一名UCSF医学院学生,同时也是加州大学洛杉矶分校的数据科学家。过去三年来,他在outlace.com上发表了大量有关机器学习的博文。

参考:

https://www.manning.com/books/deep-reinforcement-learning-in-action

https://github.com/DeepReinforcementLearning/DeepReinforcementLearningInAction

▌详细目录



▌第一部分 基础

▌第二部分 延伸


▌附录


▌第一章详细内容



-END-

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-08-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI派

吴恩达|机器学习秘籍(Machine Learning Yearning)

人工智能(AI)、机器学习(Machine Learning )和深度学习(Deep Learning )正在改变很多行业,吴恩达(Andrew Ng)老师编写...

1494
来自专栏人工智能头条

专访微软研究院俞栋:基于深度学习的语音识别及CNTK的演进

1795
来自专栏人工智能头条

面试了8家公司,他们问了我这些机器学习题目......

2476
来自专栏BestSDK

今日头条公布算法:解密“垃圾信息”是如何诞生的

“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。”曹欢欢希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来。此外,...

4178
来自专栏大数据文摘

电脑识别图像的极限在何处?

23911
来自专栏社区的朋友们

个性化资讯推荐算法 ( 下 )

头条为何能取得成功?很多人会说是头条的个性化推荐技术做得好,个人认为其实不尽然。本文罗列了相关的个性化推荐技术,特别是资讯推荐常用的算法,带大家从“内行”的角度...

1.7K0
来自专栏小小挖掘机

推荐系统遇上深度学习(十四)--强化学习与推荐系统的强强联合!

之前学习了强化学习的一些内容以及推荐系统的一些内容,二者能否联系起来呢!今天阅读了一篇论文,题目叫《DRN: A Deep Reinforcement Lear...

1923
来自专栏AI研习社

如何在 15 个月内占领 Kaggle 榜首?bestfitting 经验大放送

雷锋网 AI 研习社按:相信玩过 Kaggle 比赛的人都知道 bestfitting,他在加入 Kaggle 社群短短两年之内,就以黑马之姿成功占领比赛排行榜...

922
来自专栏携程技术中心

干货 | 助理来也胡一川:深度学习在智能助理中的应用

作者简介 胡一川,来也联合创始人和CTO。来也专注于智能对话技术,让每个人拥有助理。此前,胡一川联合创立了影视推荐引擎"今晚看啥"并被百度收购,后加入百度任资深...

3887
来自专栏新智元

UCSB研究发现计算机与人类视觉差异,用人眼搜索策略提升计算机视觉

【新智元导读】 加州大学圣巴巴拉分校的研究人员发现,当人类在寻找一个特定的物体时,经常容易看漏大小与场景的其余部分不相匹配的物体。他们研究这一现象,试图更好地理...

3687

扫码关注云+社区