腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
openai
健身房
中
避免
非法
状态
、
我正在尝试为一个模拟问题创建一个
健身房
环境。
在
我的
健身房
环境
中
,我有一组
非法
的
状态
,我不希望我的经纪人进入这些
状态
。将这样的逻辑添加到我的环境中最简单的方法是什么,我应该使用包装器类吗?我没有完全理解它们,我试图通过继承一个类来扩展MultiDiscrete空间,并覆盖MulriDiscrete.sample函数来阻止环境进入
非法
状态
,但是有没有更有效的方法来做到这一点?
浏览 13
提问于2020-04-01
得票数 0
1
回答
OpenAI
健身房
自定义环境:具有实值的离散观察空间
、
、
、
我想创建自定义的
openai
健身房
环境,它有离散的
状态
空间,但有浮点值。.,19.75,20.0 有没有办法
在
openai
健身房
定制环境
中
做到这一点,使用离散空间,盒子,MultiDiscrete或其他一些空间?离散需要一个整数,而Box似乎没有某种step参数。
浏览 30
提问于2019-06-11
得票数 4
回答已采纳
1
回答
在
OpenAI
健身房
环境
中
,初始
状态
是随机的还是特定的?
、
是
在
像
OpenAI
健身房
这样的强化学习环境
中
随机选择的初始
状态
。换句话说,命令env.reset()产生的是随机选择的初始
状态
还是特定的初始
状态
?
浏览 16
提问于2019-12-29
得票数 2
回答已采纳
2
回答
在
开放式AI
健身房
中
实现策略迭代方法
、
、
、
我正在尝试使用
OpenAI
健身房
来解决一个简单的问题,比如CartPole或连续的山地车。我使用的是python。 如果不是,我如何计算这些值,并使用环境?
浏览 12
提问于2017-08-01
得票数 3
1
回答
强化学习
中
的无效动作
、
我已经为一个类似于的游戏实现了一个自定义的
openai
健身房
环境,但使用的是谨慎的操作而不是连续的。因此,我的代理可以
在
每一步
中
从左/上/右/下四个方向中选择一个。然而,这些操作
中
的一个总是会导致代理自身崩溃,因为它不能“反向”。 目前,我只是让代理执行任何移动,如果它执行了无效的移动,就让它死掉,希望它最终会学会在那种
状态
下不执行该操作。然而,我读到有人可以将进行
非法
移动的概率设置为零,然后对动作进行采样。有没有其他方法来解决这个问题?
浏览 0
提问于2017-11-01
得票数 0
2
回答
观察意义-
OpenAI
健身房
、
、
、
、
我想知道
OpenAI
健身房
()的CartPole-v0观察规范。 例如,在下面的代码
中
输出observation。
浏览 2
提问于2016-09-06
得票数 9
1
回答
OpenAI
健身房
的可视化是如何在Docker
中
工作的?
、
我想让
OpenAI
健身房
在
一个码头容器内使用渲染的OpenGL可视化。我该怎么做呢?
浏览 3
提问于2016-05-29
得票数 4
1
回答
OpenAI
-Gym
中
的定制环境
、
、
我想试用Python
中
的强化学习。但我想为我自己的国家和奖励创造一个定制的环境。 可能我想使用时间序列数据在这(但不像股票)。我想让我的系统按照时间来学习行为,给出一个环境。
浏览 0
提问于2019-02-21
得票数 2
1
回答
如何查看gym.make('env')内部发生了什么
、
、
、
、
为了创建自己的环境并使用github的一些代码,我需要查看gym.make('env')内部发生了什么,例如gym.make('carpole0')
在
健身房
里的github,我能找到它吗?我找到了https://github.com/
openai
/gym/blob/master/gym/envs/classic_control/cartpole.py,但它没有做吗?如何编写“为DQN定义环境(env)
浏览 0
提问于2018-05-23
得票数 0
回答已采纳
1
回答
在
某些连续空间的RL库
中
,可以通过舍入来实现离散空间的强化学习算法吗?
、
对于离散的动作空间环境,RL算法可以通过简单地映射(或舍入)agent
在
连续空间范围(
健身房
环境)
中
的动作到
openai
健身房
环境
中
的离散动作来实现RL算法吗?
浏览 3
提问于2022-01-21
得票数 0
1
回答
安装box2d
健身房
、
、
、
kwargs)~\anaconda3\lib\site-packages\gym\envs\registration.py in make(self,path,**kwargs) 127 if ":“
在
路径
中
浏览 5
提问于2022-02-19
得票数 0
1
回答
如何在
OpenAI
健身房
中
列出每个
状态
的可能后继
状态
?(严格适用于普通MDP)
、
、
、
、
有没有一种方法可以遍历每个
状态
,强制环境转到那个
状态
,然后执行一步,然后使用返回的"info“字典来查看所有可能的后继
状态
?或者一种更简单的方法来恢复每个
状态
的所有可能的后继
状态
,可能隐藏在某个地方?我在网上看到一个叫MuJoKo或类似的东西有一个set_state功能,但我不想创建一个新的环境,我只想设置
openAi
健身房
已经提供的环境的
状态
。上下文:尝试实现拓扑顺序值迭代,这需要制作一个图,其中每个
状态
都有到任何
浏览 0
提问于2018-12-09
得票数 0
2
回答
AttributeError:模块'ale_py.gym‘没有特性'ALGymEnv’
、
我运行了Jupiter笔记本
中
的代码,我尝试了几种不同的方法,但找不到解决这个问题的合适方法。”
浏览 605
提问于2021-09-29
得票数 0
1
回答
openAI
健身房
将数据保存为时间序列
openAI
健身房
环境能够将结果打印到屏幕上,还可以渲染视频。是否有现有的命令或包装器/监视器来保存
状态
和操作的时间序列数据?我想在时频域中分析它的性能。我想我可以
在
每次动画更新时将数据写入文件,但我很好奇别人是如何做到这一点的。
浏览 11
提问于2020-08-22
得票数 0
3
回答
OpenAI
健身房
:安装Atari依赖项时出现问题(Mac )
、
我刚来
OpenAI
健身房
。我已经成功地
在
我的Mac (High Sierra 10.13.3)笔记本电脑上安装了
OpenAI
健身房
,并为CartPole游戏创建了一个
OpenAI
。我试过了:并确保Atari已成功安装(我
在
gym目录中看到atari_py与gym和atari
在
同一目录
中
)。
浏览 1
提问于2018-04-21
得票数 1
2
回答
如何在
OpenAI
健身房
中
撤消动作?
、
、
在
OpenAI
健身房
,我想知道同一
状态
下不同动作的下一个
状态
。例如,我想要获取s_1,s_2,其中我的环境的动态是:我找不到一种方法可以撤消某个操作,或者
在
不更改环境的情况下显示下一个
状态
。
浏览 8
提问于2016-08-25
得票数 2
2
回答
如何从山地汽车的自定义初始
状态
开始环境?
、
我想从一个自定义的起始点开始,开始
OpenAI
健身房
的连续山车环境。
OpenAI
健身房
没有提供任何方法来做到这一点。我查看了环境的,发现有一个包含
状态
信息的属性state。我试图手动更改该属性。您可以看到附加的代码,
状态
函数返回的观察结果与env.state变量不匹配。 我认为这是一些基本的Python问题,它不允许我访问属性。是否有任何方法来访问该属性或从自定义初始
状态
开始的其他方式?我知道我可以从现有的代码
中
创建一个自定义环境(),也可以添加这个功
浏览 7
提问于2019-07-30
得票数 5
回答已采纳
1
回答
进入和退出模块环境?
、
、
、
我也问过这里这个问题,但我觉得最好把它移到一个专门的Ubuntu论坛上:user@localhost:~$(gym) user@localhost:~$(gym) user@localhost:现在,当我再次启动终端时,它是
在
user@localhost:~$
状态
下启动的,当我试图运行一个脚本时,它不识别gym模块,只说ModuleNotFou
浏览 0
提问于2018-01-03
得票数 0
4
回答
多智能体游戏的
Openai
健身环境
、
在
多智能体游戏中可以使用的吗?具体来说,我想用四个玩家(代理)来模拟一个纸牌游戏。得分的玩家将在下一个回合开始。我如何建模玩家之间的必要协调(例如,谁是下一个)?
浏览 5
提问于2017-06-05
得票数 29
回答已采纳
5
回答
Windows环境下的
OpenAI
健身馆
、
、
我
在
Windows10上安装
OpenAI
健身房
环境有问题。我已经成功地安装和使用了相同的系统上的
OpenAI
健身房
。以下是错误:这是我目前
在
我的系统上所拥有的.cmake和make都清楚地安装了。
浏览 9
提问于2017-03-05
得票数 44
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 Java 8 中避免 Null 检查
放眼长远,才能避免在短期利益中迷失
OpenAI 在 API 中引入结构化输出
在购买租用服务器业务中应该如何避免上当
账户操作中有哪些常见的误区需要避免在快手广告中?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券