Python强化学习实战,Anaconda公司的高级数据科学家讲解

【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始介绍强化学习Python实践经验,并以强化学习中的经典任务--Cartpole问题作为学习的入门例子,讲解从环境搭建、模型训练再到最后的效果评估的结果。

▌简介

Cartpole描述的问题可以认为是:在一辆小车上竖立一根杆子,然后给小车一个推或者拉的力,使得杆子尽量保持平衡不滑倒。

更详细的描述可参见openai官网上关于Cartpole问题的解释:https://gym.openai.com/envs/CartPole-v0

▌强化学习用到的python库

OpenAI

Gym: Toolkit for developing and comparing reinforcement learningalgorithms. MIT License, Last commit: November 2017

baselines: high-quality implementations of reinforcement learning algorithms,MIT License, Last commit: November 2017

TensorForce, A TensorFlow library for applied reinforcement learning, Apache 2,Last commit: November 2017

DeepRL, Highly modularized implementation of popular deep RL algorithms byPyTorch, Apache 2 License, Last commit: November 2017

RLlab, a framework for developing and evaluating reinforcement learningalgorithms, MIT License, Last commit: July 2017

AgentNet, Python library for deep reinforcement learning usingTheano+Lasagne, MIT License, Last commit: August 2017

RLPy, the Reinforcement Learning Library for Education and Research,3-Clause BSD License, Last commit: April 2016.

PyBrain, the Python Machine Learning Library, 3-Clause BSD License, Lastcommit: March 2016.

▌强化学习资源

Reinforcement Learning courseby David Silver

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

https://blog.acolyer.org/2017/11/17/mastering-the-game-of-go-without-humanknowledge/

https://keon.io/deep-q-learning/

https://rishav1.github.io/reinlearning/2017/01/05/simple-swarm-intelligenceoptimization-for-cartpole-balancing-problem.html

AlphaGo Zero's win, what itmeans, Fast Forward Labs: http:// blog.fastforwardlabs.com/2017/10/25/alphago-zero.html

更多可以查看专知以前推出的强化学习荟萃资料:

▌PPT内容

参考链接:

https://speakerdeck.com/chdoig/rl-pytexas-2017

本文来自企鹅号 - 专知媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【资源】Python强化学习实战,Anaconda公司的高级数据科学家讲解(附相关Python开源库)

【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christi...

2844
来自专栏AI研习社

2017 十大最受欢的迎机器学习 Python 库

2017 年即将结束,又到了做年终总结的时候,本文盘点了今年最受欢迎的十个 Python 机器学习库,同时在文末选出了一些值得关注的 Python 库。如果本文...

2906
来自专栏数据科学与人工智能

【Python环境】Python 网页爬虫 &文本处理 & 科学计算 &机器学习 &数据挖掘兵器谱

曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。...

2179
来自专栏Data Analysis & Viz

Python网页爬虫&文本处理&科学计算&机器学习&数据挖掘兵器谱

周末时看到这篇不错的文章,其中介绍了诸多python第三方库和工具,与大家分享下,也算是门可罗雀的本号第一次转载文章。后续看到精彩的文章也会继续分享。

662
来自专栏CVer

TensorFlow从入门到精通 | 预告篇

[TensorFlow从入门到精通]系列课程既包含TensorFlow的基础知识点(如Graph),还有卷积神经网络、模型的保存和恢复、迁移学习、Fine-Tu...

1004
来自专栏智能算法

Python相关机器学习‘武器库’

开始学习Python,之后渐渐成为我学习工作中的第一辅助脚本语言,虽然开发语言是Java,但平时的很多文本数据处理任务都交给了Python。这些年来,接触和...

513
来自专栏专知

当深度学习遇见大数据:一文概览BDL学习框架

【导读】深度学习的出现让许多机器学习从业者将目光从Spark等大数据计算框架转移到了TensorFlow、PyTorch等深度学习框架上。然而,大数据框架与深度...

1005
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/4/1

注意下面很多链接需要科学上网,无奈国情如此 1. TensorFlow开发者峰会昨天召开,我觉得有趣的演讲有 - TF Hub ("一键"transfer l...

3018
来自专栏数据科学与人工智能

【开源工具】国外程序员整理的机器学习资源大全

本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。 C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 ...

2839
来自专栏编程

Python数据挖掘学习路线是什么?学习Python学什么?

学习Python数据挖掘,你有明确的路线吗,学任何东西首先你要知道学习它的路线,了解了路线才能更容易学习,学习起来才不会非常费劲,进入正题,看看千锋教育的Pyt...

19810

扫码关注云+社区