DeepMind 开源基于 MuJoCo 物理引擎强化学习工具 Control Suite

DeepMind Control Suite 是 DeepMind 最新开源的,一套有标准化结构的持续控制任务,旨在成为强化学习 Agent 的性能基准。Control Suite 由 Python 编写,并由 MuJoCo 物理引擎驱动。

论文:

https://arxiv.org/abs/1801.00690

代码:

https://github.com/deepmind/dm_control

演示视频:

安装和要求:

1.从 MuJoCo(http://www.mujoco.org/) 上下载 MuJoCo Pro 1.50,在安装 MuJoCo Pro 之前必须先装好 dm_control, dm_control 的安装脚本会基于 MuJoCo 的头文件生成 Python ctypes 绑定。默认情况下,dm_control会假定 MuJoCo Zip 文件将被提取到 ~/.mujoco/mjpro150 文件夹。

2.通过运行 pip install git+git://github.com/deepmind/dm_control.git 安装 dm_control Python 包,或者克隆 Github 代码库然后运行 pip install /path/to/dm_control/。在安装期间,dm_control 会在 ~/.mujoco/mjpro150/include 的步骤 1 里寻找 MuJoCo 头文件,不过该路径可通过 headers-dir 命令配置。

3.在运行时,dm_control 会要求安装 license key,详情请查看 MuJoCo license key (https://www.roboti.us/license.html)页面。默认情况下,dm_control 在 ~/.mujoco/mjkey.txt 路径寻找 MuJoCo license key。

4.如果将 license key (例如,mjkey.txt) 或 MuJoCo Pro 所提供的共享库(例如,libmujoco150.so或 libmujoco150.dylib)安装到非默认路径,需要用 MJKEY_PATH 和 MJLIB_PATH 环境变量来指定其路径。

macOS 用户 Homebrew 额外安装说明

1.只要你是用 Homebrew 安装的 Python 解释器 (注意:不是系统默认的解释器),使用上述 pip 安装命令一般是可行的。

2.获取 OpenGL 之前,需要通过运行 brew install glfw 从 Homebrew 安装 glfw。

3.在运行之前,DYLD_LIBRARY_PATH 的环境变量要用 GLFW 库路径来更新,通过运行 export DYLD_LIBRARY_PATH=$(brew --prefix)/lib:$DYLD_LIBRARY_PATH 即可。

Control Suite 快速入门

from dm_control import suite

# Load one task:
env = suite.load(domain_name="cartpole", task_name="swingup")

# Iterate over a task set:
for domain_name, task_name in suite.BENCHMARKING:
  env = suite.load(domain_name, task_name)

# Step through an episode and print out reward, discount and observation.
action_spec = env.action_spec()
time_step = env.reset()
while not time_step.last():
  action = np.random.uniform(action_spec.minimum,
                             action_spec.maximum,
                             size=action_spec.shape)
  time_step = env.step(action)
  print(time_step.reward, time_step.discount, time_step.observation)

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-01-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏緣來來來

树莓派基本配置与Docker的安装

https://www.raspberrypi.org/downloads/raspbian/

1.9K20
来自专栏圣杰的专栏

eShopOnContainers 知多少[3]:Identity microservice

通常,服务所公开的资源和 API 必须仅限受信任的特定用户和客户端访问。那进行 API 级别信任决策的第一步就是身份认证——确定用户身份是否可靠。

16320
来自专栏Core Net

ASP.NET Core 2.1 : 十三.httpClient.GetAsync 报SSL错误的问题

不知什么时候 ,出现了这样的一个奇怪问题,简单的httpClient.GetAsync("xxxx")居然报错了。

12520
来自专栏.NET开发者社区

一步一步创建ASP.NET MVC5程序[Repository+Autofac+Automapper+SqlSugar](三)

上一篇《一步一步创建ASP.NET MVC5程序[Repository+Autofac+Automapper+SqlSugar](二)》我们通过如下操作:

262100
来自专栏Samego技术资源分享

玩玩树莓派之自动连接无线路由器

21340
来自专栏NetCore

Do You Kown Asp.Net Core -- Asp.Net Core 2.0 未来web开发新趋势 Razor Page

Razor Page介绍 前言     上周期待已久的Asp.Net Core 2.0提前发布了,一下子Net圈热闹了起来,2.0带来了很多新的特性和新的功能,...

36660
来自专栏黑白安全

如何用树莓派实现WiFi钓鱼

 首先登场的是Kali Linux,它是基于Debian的Linux发行版,在数字取证和渗透测试有较大的优势。你可以在你的笔记本上安装该系统,然后就可以用它...

39730
来自专栏张善友的专栏

Microsoft Web Farm Framework (WFF) 2.0正式发布

Microsoft Web Farm Framework (WFF) 2.0 是微软开发的、基于IIS 7.x的小插件,能够帮助我们轻松实现Web网站的高性能、...

23580
来自专栏一个会写诗的程序员的博客

《Springboot极简教程》SpringBoot plus Mongodb开发企业级restfeel接口测试平台RESTFeel功能简介:MongoDB configuration:Buildin

The build file is configured to download and use an embedded Tomcat server. So t...

10630
来自专栏ASP.NETCore

.Net Core迁移到MSBuild平台(二)

在上一篇文章.Net Core迁移到MSBuild的多平台编译问题中,简单的讲了下新的项目配置文件中的节点配置,这篇我将用一些例子来详细讲下从project.j...

16520

扫码关注云+社区

领取腾讯云代金券