首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度强化学习系列之-OpenAI-Baselines的使用方法

本文同步发在楼主博客:

更多强化学习更新将与博客互相同步推送,敬请关注:

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用

OpenAI、DeepMind,伯克利三个可以说是强化学习的推动者,其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子,以A2C算法为例子(具体a2c算法原理后续讲解):

首先就是安装gym环境,具体直接参考OpenAI的github: https://github.com/openai/gym

本文使用了Atari游戏,那么在gym中需要安装,不然有的游戏可能不会默认安装:

这是原话:The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:

下一步就是clone baselines的仓库了:

然后进入目录进行运行:

就可以了,其他的算法同样的道理。

注意:此处使用给的是python3,

那么对应需要在python3下安装numpy, matplotlib, tensorflow, 等一系列库,此处省略

注意:如果使用OpenAI的baselines运行Mujoco环境,可能存在一些列问题,下一篇文章将会介绍!敬请期待,欢迎大家互相讨论学习!

参考:

https://github.com/openai/gym

https://github.com/openai/baselines

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180611G17SQU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券