深度强化学习系列之-OpenAI-Baselines的使用方法

文章来源：企鹅号 - 深度强化学习算法

本文同步发在楼主博客：

更多强化学习更新将与博客互相同步推送，敬请关注：

OpenAI，由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后，决定共同创建OpenAI，希望能够预防人工智能的灾难性影响，推动人工智能发挥积极作用

OpenAI、DeepMind，伯克利三个可以说是强化学习的推动者，其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子，以A2C算法为例子（具体a2c算法原理后续讲解）：

首先就是安装gym环境，具体直接参考OpenAI的github： https://github.com/openai/gym

本文使用了Atari游戏，那么在gym中需要安装，不然有的游戏可能不会默认安装：

这是原话：The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:

下一步就是clone baselines的仓库了：

然后进入目录进行运行：

就可以了，其他的算法同样的道理。

注意：此处使用给的是python3,

那么对应需要在python3下安装numpy, matplotlib, tensorflow, 等一系列库，此处省略

注意：如果使用OpenAI的baselines运行Mujoco环境，可能存在一些列问题，下一篇文章将会介绍！敬请期待，欢迎大家互相讨论学习！

参考：

https://github.com/openai/gym

https://github.com/openai/baselines

发表于: 2018-06-112018-06-11 16:54:27
原文链接：https://kuaibao.qq.com/s/20180611G17SQU00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

深度强化学习系列之-OpenAI-Baselines的使用方法

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐