OpenAI健身房cartpole-v0理解观察和动作关系

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、

我对建模系统很感兴趣，这个系统可以使用openai健身房来制作一个模型，不仅表现良好，而且希望更好，而且不断改进，以收敛于最好的动作。这就是我初始化env的方法env = gym.make("CartPole-v0")它返回一组信息；观察，奖励，完成和信息，信息总是没有，所以忽略它。因为这些是随机采样的动作，所以是随机移动。我认为我看到的可能是第一次观察到，如果它达到0，游戏结束，但

浏览 11提问于2018-08-28得票数 0

回答已采纳

2回答

观察意义- OpenAI健身房

、、、、

我想知道OpenAI健身房()的CartPole-v0观察规范。env = gym.make('CartPole-v0') observation = env.reset()

浏览 2提问于2016-09-06得票数 9

3回答

仅在木星笔记本中显示OpenAI健身房

、、、、

我想在笔记本上和OpenAI健身房一起玩，健身房也是在线的。matplotlib.pyplot as pltfrom IPython import display env.step(env.action_space.sample()) # take a random action 这起作用了，我在笔记本上看到了健身房<

浏览 1提问于2018-10-09得票数 21

1回答

OpenAI健身房环境'CartPole-v0‘与'CartPole-v1’的差异

、、

我找不到OpenAI健身房环境'CartPole-v0‘和'CartPole-v1’之间的差异的确切描述。这两个环境都有独立的官方网站(请参阅和)，尽管我在gym github存储库中只能找到一个没有版本标识的代码(请参阅)。唯一的区别似乎在于他们内部分配的max_episode_steps和reward_threshold，可以如下所示进行访问。CartPole-v0的值为200/195.0，CartPole-v1的值为500/

浏览 236提问于2019-07-05得票数 18

回答已采纳

2回答

OpenAI健身房-如何创建一个热的观测空间？

、、

我需要知道正确的方法来创造：谢谢

浏览 1提问于2019-01-03得票数 1

回答已采纳

4回答

多智能体游戏的Openai健身环境

、

在多智能体游戏中可以使用的吗?具体来说，我想用四个玩家(代理)来模拟一个纸牌游戏。得分的玩家将在下一个回合开始。我如何建模玩家之间的必要协调(例如，谁是下一个)？最终，我想使用强化学习来学习四个互相对抗的代理。

浏览 5提问于2017-06-05得票数 29

回答已采纳

2回答

openai健身房-什么是我可以使用的多离散动作空间的代理？

、、、

我有一个有多个离散动作空间的定制环境。行动和观察空间如下：MultiDiscrete([ 3 121 121 121 3 121 121 121 3 121 121 121 3 121 121 121 3 1213 121 121 121 3 121 121 121 3 121观察我需要一个与我的动作空间相同形状的输出。如何处理这件事？

浏览 0提问于2019-07-03得票数 2

回答已采纳

5回答

如何设置openai-健身房环境，从特定的状态开始，而不是`env.reset()`？

、、

今天，当我试图在openai-健身房环境下实现一个rl代理时，我发现了一个问题，似乎所有的代理都是从最初始的状态训练出来的：env.reset()，即initial_observation = env.reset() # <-- Note action就像这样： env = gym.make("CartPole-v0</

浏览 0提问于2019-09-08得票数 7

回答已采纳

3回答

有没有一种方法可以在OpenAI健身房中禁用视频渲染，同时仍在录制它？

、

有没有一种方法可以在OpenAI健身房中禁用视频渲染，同时仍在录制它？当我使用atari环境和Monitor包装器时，默认行为是不渲染视频(视频仍然被录制并保存到磁盘)。然而，在MountainCarContinuous-v0、CartPole-v0、Pendulum-v0等简单环境中，渲染视频是默认行为，我找不到如何禁用它(我仍然想将其保存到磁盘)。

浏览 2提问于2017-12-06得票数 7

1回答

Python强化学习-元组观察空间

、、、、

我创建了一个自定义的openai健身房环境，它有一个离散的动作空间和一个有点复杂的状态空间。状态空间被定义为元组，因为它结合了一些连续的维度和其他离散的维度： import gym def对于可以处理这种观察空间的RL包，有什么建议吗？目前看来，openai基线和稳定基线都不能处理它。或者，有没有一种不同的方式可以定义我的状态空间，以便将我的环

浏览 73提问于2019-10-09得票数 4

回答已采纳

1回答

OpenAI Gym ProcGen -获得行动意义

、、

在OpenAI ProcGen健身房，我没有办法让获得动作值的含义，我可以看到，对于使用env.action_space.n的coinrun环境，有15个动作。我试过健身房和Gym3版本。这就是我如何创造环境(健身房版)。这两种方法似乎都不起作用。env.action_spec() env.env.get_action_mea

浏览 5提问于2020-06-12得票数 1

回答已采纳

2回答

从简介页面运行演示程序OpenAI* Gym错误*

我安装了OpenAI健身房，并试图运行入门购物车杆演示().(我正在Colab笔记本上跑步。)import gymenv.reset() env.render()这不学习，但它应该显示手推车和杆。当我运行它时，我会收到一个警告和一个错误。 WARN

浏览 1提问于2018-05-15得票数 1

回答已采纳

1回答

openai-gym经典控件在centos服务器上的渲染问题

、

我正在玩RL colab，它使用健身房的CartPole-v0。我通过连接到远程centOS 7.3服务器(而不是谷歌驱动器)的jupyter打开了iPython笔记本。pip install gym[classic_control]env = gym.make('CartPole-v0')img = env.renderlen(self.format) * self.width * self.height))() 结果要么是(4 0 0)，要么是(4 155151283

浏览 40提问于2020-10-26得票数 0

1回答

action_space是用来做什么的？

我在OpenAI健身房做自定义环境，真的不明白，action_space是用来做什么的？我应该在里面放些什么？准确地说，我不知道什么是action_space，我没有在任何代码中使用它。

浏览 153提问于2019-06-17得票数 5

回答已采纳

4回答

如何解释OpenAI健身房对内存环境的观察？

、

在一些OpenAI健身房环境中，有一个"ram“版本。例如：Breakout-v0和Breakout-ram-v0。使用Breakout-ram-v0，每个观察都是一个长度为128的数组。问题：我如何将Breakout-v0的观察(即160x210图像)转换为Breakout-ram-v0 (长度为128的数组)的观察形式？

浏览 4提问于2017-07-20得票数 6

2回答

在开放式AI健身房中实现策略迭代方法

、、、

我正在尝试使用OpenAI健身房来解决一个简单的问题，比如CartPole或连续的山地车。我使用的是python。如果不是，我如何计算这些值，并使用环境？

浏览 12提问于2017-08-01得票数 3

1回答

具有稳定基线的自定义Openai健身房环境

、、

我正在尝试创建一个简单的2D网格世界，Openai健身房环境，代理从网格世界中的任何地方到终端单元。例如，在5x5网格世界中，X是当前代理位置，O是代理流向的终端单元。.......X......O 离散值i，它表示代理的当前位置，是一个2d矩阵，除代理当前位置为1外，所有矩阵

浏览 3提问于2020-12-09得票数 0

1回答

如何获得连续动作空间PPO强化学习的整数作为输出？

、

我有一个庞大的离散动作空间，学习稳定性不好。我想要移动到连续的操作空间，但是任务的唯一输出可以是正整数(假设在0到999之间)。如何强制DNN输出正整数？

浏览 6提问于2022-08-03得票数 -1

3回答

openAi-健身房NameError

、、、、

我正尝试在WSL上使用来自OpenAI的著名的'Gym‘模块，并在python3.5.2上执行代码。当我尝试运行环境时，使用以下代码：env = gym.make('CartPole-v0') observation

浏览 5提问于2017-05-24得票数 29

2回答

如何在OpenAI健身房中撤消动作？

、、

在OpenAI健身房，我想知道同一状态下不同动作的下一个状态。如果有帮助，我这样做是为了区分LQR的动态和奖励，并使用InvertedPendulum环境。

浏览 8提问于2016-08-25得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云