如何查看OpenAI健身房环境中可用的动作？_如何在OpenAI健身房中撤消动作？_在定制的OpenAI健身房环境中传递参数 - 腾讯云开发者社区

、

对于离散的动作空间环境，RL算法可以通过简单地映射(或舍入)agent在连续空间范围(健身房环境)中的动作到openai健身房环境中的离散动作来实现RL算法吗？

浏览 3提问于2022-01-21得票数 0

2回答

如何查看OpenAI健身房环境中可用的动作？

、、

似乎Open AI健身房环境的操作列表甚至在文档中都不可用。例如，假设你想玩Atari Breakout。可用的操作将是右、左、上和下。print(env.action_space.n)如果我打印动作空间中可用动作的数量，它会像我预期的那样打印4个动作。然而，我想看到的是动作列表，比如right、up、punch(可能是boxing-v1)、ju

浏览 42提问于2020-07-27得票数 2

1回答

OpenAI健身房的可视化是如何在Docker中工作的？

、

我想让OpenAI健身房在一个码头容器内使用渲染的OpenGL可视化。我该怎么做呢？

浏览 3提问于2016-05-29得票数 4

1回答

OpenAI Gym ProcGen -获得行动意义

、、

在OpenAI ProcGen健身房，我没有办法让获得动作值的含义，我可以看到，对于使用env.action_space.n的coinrun环境，有15个动作。我试过健身房和Gym3版本。这就是我如何创造环境(健身房版)。这两种方法似乎都不起作用。请告诉我

浏览 5提问于2020-06-12得票数 1

回答已采纳

1回答

如何获得连续动作空间PPO强化学习的整数作为输出？

、

我有一个庞大的离散动作空间，学习稳定性不好。我想要移动到连续的操作空间，但是任务的唯一输出可以是正整数(假设在0到999之间)。如何强制DNN输出正整数？

浏览 6提问于2022-08-03得票数 -1

1回答

OpenAI健身房在外部控制环境中的步进

、

我想在这个环境中使用OpenAI及其基线算法来执行学习。为此，我想通过编写一些与OpenAI环境API相对应的适配器代码来调整模拟。但是有一个问题:控制流是由代理在OpenAI设置中定义的。但在我的世界里，环境是独立的，独立于智能体。如果智能体没有做出决定，或者速度不够快，世界就会在没有他的情况下继续运行。如何实现触发下一步的逆转？简而言之:

浏览 1提问于2018-05-19得票数 0

1回答

OpenAI健身房和Gazebo测试机器人的RL算法？

、、、、

如果我想研究用于机器人的RL算法，我应该如何使用Gazebo和OpenAI健身房来测试、训练和测试该算法？我是否应该从OpenAI健身房开始，把分数很高的算法带到Gazebo环境中去，以适应现实世界的场景？

浏览 2提问于2017-03-27得票数 3

2回答

如何在OpenAI中创建一个新的健身房环境？

、、

我想用OpenAI健身房创建一个新的环境，因为我不想使用现有的环境。如何创建新的自定义环境？另外，有没有其他方法可以让我开始开发使AI代理在没有OpenAI健身房的帮助下玩特定的视频游戏？

浏览 2提问于2017-07-13得票数 92

回答已采纳

1回答

如何实现强化学习模型？

、

我有一些关于强化学习的问题。我已经研究了强化学习的所有数学背景，但我不能编写这个模型的代码。我还发现了下面的列表。论文到底是什么？它们是实现强化学习模型的框架吗？你能给我一个链接，来源，视频，

浏览 3提问于2020-10-30得票数 2

1回答

OpenAI健身房的突破-V0“暂停”

当我在OpenAI健身房环境中训练时，我认为环境有时会“停止”。在一排的许多帧中，没有一个球是可见的/停止产卵。什么都不做/站着不动？ 1-什么也不做&#x

浏览 0提问于2017-06-27得票数 5

回答已采纳

1回答

action_space是用来做什么的？

我在OpenAI健身房做自定义环境，真的不明白，action_space是用来做什么的？我应该在里面放些什么？准确地说，我不知道什么是action_space，我没有在任何代码中使用它。我在网上找不到任何东西，有什么可以正常回答我的问题。

浏览 153提问于2019-06-17得票数 5

回答已采纳

2回答

在开放式AI健身房中实现策略迭代方法

、、、

我目前正在阅读Sutton & Barto的“强化学习”，我正在尝试自己编写一些方法。但是，对于策略迭代，我需要状态之间的转换矩阵和奖励矩阵。这些是从你在OpenAI健身房构建的‘环境’中获得的吗？我使用的是py

浏览 12提问于2017-08-01得票数 3

2回答

openai健身房-什么是我可以使用的多离散动作空间的代理？

、、、

我有一个有多个离散动作空间的定制环境。121 121 121 121 121 121我很难找到一个能够处理这些空间的代理这个问题：https://github.com/keras-rl/keras-rl/issues/224表示keras-rl DDPG代理能够处理多个离散的操作空间，但是模型有一个浮点输出，我不能将它用

浏览 0提问于2019-07-03得票数 2

回答已采纳

1回答

如何查看gym.make('env')内部发生了什么

、、、、

为了创建自己的环境并使用github的一些代码，我需要查看gym.make('env')内部发生了什么，例如gym.make('carpole0') 在健身房里的github，我能找到它吗？我找到了https://github.com/openai/gym/blob/master/gym/envs/classic_control/c

浏览 0提问于2018-05-23得票数 0

回答已采纳

1回答

是否可以在训练前和训练期间修改OpenAI健身房状态？

、、、

我想要做的是修改一个环境，例如，以Super Mario Bros健身房环境为例，模糊智能体训练的图像，看看强化学习智能体是否仍然能够在这些“模糊”状态上学习。 OpenAI使这样的事情成为可能吗？如何添加健身房环境预处理步骤？

浏览 38提问于2020-11-11得票数 1

回答已采纳

1回答

OpenAI健身房自定义环境:具有实值的离散观察空间

、、、

我想创建自定义的openai健身房环境，它有离散的状态空间，但有浮点值。更精确地说，它应该是一个0.25步长的值范围: 10.0，10.25，10.5，10.75，11.0，...，19.75，20.0 有没有办法在openai健身房定制环境中做到这一点，使用离散空间，盒子

浏览 30提问于2019-06-11得票数 4

回答已采纳

4回答

多智能体游戏的Openai健身环境

、

在多智能体游戏中可以使用的吗?具体来说，我想用四个玩家(代理)来模拟一个纸牌游戏。得分的玩家将在下一个回合开始。我如何建模玩家之间的必要协调(例如，谁是下一个)？最终，我想使用强化学习来学习四个互相对抗的代理。

浏览 5提问于2017-06-05得票数 29

回答已采纳

1回答

OpenAI-Gym中的定制环境

、、

我想试用Python中的强化学习。但我想为我自己的国家和奖励创造一个定制的环境。可能我想使用时间序列数据在这(但不像股票)。我想让我的系统按照时间来学习行为，给出一个环境。所以我首先要做一个定制的环境，有人能帮我吗？

浏览 0提问于2019-02-21得票数 2

2回答

如何在OpenAI健身房中撤消动作？

、、

在OpenAI健身房，我想知道同一状态下不同动作的下一个状态。例如，我想要获取s_1，s_2，其中我的环境的动态是：我找不到一种方法可以撤消某个操作，或者在不更改环境的情况下显示下一个状态。如果有帮助，我这样做是为了区分LQR的动态和奖励，并使用InvertedPendulum环境。

浏览 8提问于2016-08-25得票数 2

1回答

如何将元组列表作为OpenAI Gym中的操作空间进行传递？

、

从头开始创建OpenAI健身房环境时，必须定义动作空间。这是用它们自己的来自分组“空间”的“数据结构”来完成的。有几种不同类型的空间，如Box，instead等。我有一个元组列表，我想用它来代替动作空间。有没有办法做到这一点？我对解决方案持开放态度，例如使用spaces.Box，然后禁止/删除非法操作，但最好只插入我预先创建的元组列表。

浏览 2提问于2019-07-25得票数 1

点击加载更多