腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在某些连续空间
的
RL库
中
,可以通过舍入来实现离散空间
的
强化学习算法吗?
、
对于离散
的
动作
空间
环境
,RL算法可以通过简单地映射(或舍入)agent在连续空间范围(
健身房
环境
)
中
的
动作
到
openai
健身房
环境
中
的
离散
动作
来实现RL算法吗?
浏览 3
提问于2022-01-21
得票数 0
2
回答
如何
查看
OpenAI
健身房
环境
中
可用
的
动作
?
、
、
似乎Open AI
健身房
环境
的
操作列表甚至在文档中都不
可用
。例如,假设你想玩Atari Breakout。
可用
的
操作将是右、左、上和下。print(env.action_space.n)如果我打印
动作
空间中
可用
动作
的
数量,它会像我预期
的
那样打印4个
动作
。然而,我想看到
的
是
动作
列表,比如right、up、punch(可能是boxing-v1)、ju
浏览 42
提问于2020-07-27
得票数 2
1
回答
OpenAI
健身房
的
可视化是
如何
在Docker
中
工作
的
?
、
我想让
OpenAI
健身房
在一个码头容器内使用渲染
的
OpenGL可视化。我该怎么做呢?
浏览 3
提问于2016-05-29
得票数 4
1
回答
OpenAI
Gym ProcGen -获得行动意义
、
、
在
OpenAI
ProcGen
健身房
,我没有办法让获得
动作
值
的
含义,我可以看到,对于使用env.action_space.n
的
coinrun
环境
,有15个
动作
。我试过
健身房
和Gym3版本。这就是我
如何
创造
环境
(
健身房
版)。这两种方法似乎都不起作用。请告诉我
浏览 5
提问于2020-06-12
得票数 1
回答已采纳
1
回答
如何
获得连续
动作
空间PPO强化学习
的
整数作为输出?
、
我有一个庞大
的
离散
动作
空间,学习稳定性不好。我想要移动到连续
的
操作空间,但是任务
的
唯一输出可以是正整数(假设在0到999之间)。
如何
强制DNN输出正整数?
浏览 6
提问于2022-08-03
得票数 -1
1
回答
OpenAI
健身房
在外部控制
环境
中
的
步进
、
我想在这个
环境
中使用
OpenAI
及其基线算法来执行学习。为此,我想通过编写一些与
OpenAI
环境
API相对应
的
适配器代码来调整模拟。但是有一个问题:控制流是由代理在
OpenAI
设置
中
定义
的
。但在我
的
世界里,
环境
是独立
的
,独立于智能体。如果智能体没有做出决定,或者速度不够快,世界就会在没有他
的
情况下继续运行。
如何
实现触发下一步
的
逆转? 简而言之:
浏览 1
提问于2018-05-19
得票数 0
1
回答
OpenAI
健身房
和Gazebo测试机器人
的
RL算法?
、
、
、
、
如果我想研究用于机器人
的
RL算法,我应该
如何
使用Gazebo和
OpenAI
健身房
来测试、训练和测试该算法?我是否应该从
OpenAI
健身房
开始,把分数很高
的
算法带到Gazebo
环境
中去,以适应现实世界
的
场景?
浏览 2
提问于2017-03-27
得票数 3
2
回答
如何
在
OpenAI
中
创建一个新
的
健身房
环境
?
、
、
我想用
OpenAI
健身房
创建一个新
的
环境
,因为我不想使用现有的
环境
。
如何
创建新
的
自定义
环境
? 另外,有没有其他方法可以让我开始开发使AI代理在没有
OpenAI
健身房
的
帮助下玩特定
的
视频游戏?
浏览 2
提问于2017-07-13
得票数 92
回答已采纳
1
回答
如何
实现强化学习模型?
、
我有一些关于强化学习
的
问题。我已经研究了强化学习
的
所有数学背景,但我不能编写这个模型
的
代码。我还发现了下面的列表。论文到底是什么?它们是实现强化学习模型
的
框架吗? 你能给我一个链接,来源,视频,
浏览 3
提问于2020-10-30
得票数 2
1
回答
OpenAI
健身房
的
突破-V0“暂停”
当我在
OpenAI
健身房
环境
中
训练时,我认为
环境
有时会“停止”。在一排
的
许多帧
中
,没有一个球是可见
的
/停止产卵。什么都不做/站着不动? 1-什么也不做
浏览 0
提问于2017-06-27
得票数 5
回答已采纳
1
回答
action_space是用来做什么
的
?
我在
OpenAI
健身房
做自定义
环境
,真的不明白,action_space是用来做什么
的
?我应该在里面放些什么?准确地说,我不知道什么是action_space,我没有在任何代码中使用它。我在网上找不到任何东西,有什么可以正常回答我
的
问题。
浏览 153
提问于2019-06-17
得票数 5
回答已采纳
2
回答
在开放式AI
健身房
中
实现策略迭代方法
、
、
、
我目前正在阅读Sutton & Barto
的
“强化学习”,我正在尝试自己编写一些方法。但是,对于策略迭代,我需要状态之间
的
转换矩阵和奖励矩阵。这些是从你在
OpenAI
健身房
构建
的
‘
环境
’
中
获得
的
吗? 我使用
的
是py
浏览 12
提问于2017-08-01
得票数 3
2
回答
openai
健身房
-什么是我可以使用
的
多离散
动作
空间
的
代理?
、
、
、
我有一个有多个离散
动作
空间
的
定制
环境
。121 121 121 121 121 121我很难找到一个能够处理这些空间
的
代理这个问题:https://github.com/keras-rl/keras-rl/issues/224表示keras-rl DDPG代理能够处理多个离散
的
操作空间,但是模型有一个浮点输出,我不能将它用
浏览 0
提问于2019-07-03
得票数 2
回答已采纳
1
回答
如何
查看
gym.make('env')内部发生了什么
、
、
、
、
为了创建自己
的
环境
并使用github
的
一些代码,我需要
查看
gym.make('env')内部发生了什么,例如gym.make('carpole0') 在
健身房
里
的
github,我能找到它吗?我找到了https://github.com/
openai
/gym/blob/master/gym/envs/classic_control/c
浏览 0
提问于2018-05-23
得票数 0
回答已采纳
1
回答
是否可以在训练前和训练期间修改
OpenAI
健身房
状态?
、
、
、
我想要做
的
是修改一个
环境
,例如,以Super Mario Bros
健身房
环境
为例,模糊智能体训练
的
图像,看看强化学习智能体是否仍然能够在这些“模糊”状态上学习。
OpenAI
使这样
的
事情成为可能吗?
如何
添加
健身房
环境
预处理步骤?
浏览 38
提问于2020-11-11
得票数 1
回答已采纳
1
回答
OpenAI
健身房
自定义
环境
:具有实值
的
离散观察空间
、
、
、
我想创建自定义
的
openai
健身房
环境
,它有离散
的
状态空间,但有浮点值。更精确地说,它应该是一个0.25步长
的
值范围: 10.0,10.25,10.5,10.75,11.0,...,19.75,20.0 有没有办法在
openai
健身房
定制
环境
中
做到这一点,使用离散空间,盒子
浏览 30
提问于2019-06-11
得票数 4
回答已采纳
4
回答
多智能体游戏
的
Openai
健身
环境
、
在多智能体游戏中可以使用
的
吗?具体来说,我想用四个玩家(代理)来模拟一个纸牌游戏。得分
的
玩家将在下一个回合开始。我
如何
建模玩家之间
的
必要协调(例如,谁是下一个)?最终,我想使用强化学习来学习四个互相对抗
的
代理。
浏览 5
提问于2017-06-05
得票数 29
回答已采纳
1
回答
OpenAI
-Gym
中
的
定制
环境
、
、
我想试用Python
中
的
强化学习。但我想为我自己
的
国家和奖励创造一个定制
的
环境
。 可能我想使用时间序列数据在这(但不像股票)。我想让我
的
系统按照时间来学习行为,给出一个
环境
。所以我首先要做一个定制
的
环境
,有人能帮我吗?
浏览 0
提问于2019-02-21
得票数 2
2
回答
如何
在
OpenAI
健身房
中
撤消
动作
?
、
、
在
OpenAI
健身房
,我想知道同一状态下不同
动作
的
下一个状态。例如,我想要获取s_1,s_2,其中我
的
环境
的
动态是:我找不到一种方法可以撤消某个操作,或者在不更改
环境
的
情况下显示下一个状态。如果有帮助,我这样做是为了区分LQR
的
动态和奖励,并使用InvertedPendulum
环境
。
浏览 8
提问于2016-08-25
得票数 2
1
回答
如何
将元组列表作为
OpenAI
Gym
中
的
操作空间进行传递?
、
从头开始创建
OpenAI
健身房
环境
时,必须定义
动作
空间。这是用它们自己
的
来自分组“空间”
的
“数据结构”来完成
的
。有几种不同类型
的
空间,如Box,instead等。我有一个元组列表,我想用它来代替
动作
空间。有没有办法做到这一点?我对解决方案持开放态度,例如使用spaces.Box,然后禁止/删除非法操作,但最好只插入我预先创建
的
元组列表。
浏览 2
提问于2019-07-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
论嵌入在 OpenAI的5v5 DOTA2 AI 中的妙用
从Zero到Hero,OpenAI重磅发布深度强化学习资源
好家伙!B站竟然开源了一个Dota2 AI项目:影魔SOLO智能体
集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
【官方FAQ】我如何访问插件?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券