腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
openAI
健身房
将
数据
保存为
时间
序列
openAI
健身房
环境能够
将
结果打印到屏幕上,还可以渲染视频。是否有现有的命令或包装器/监视器来保存状态和操作的
时间
序列
数据
?我想在时频域中分析它的性能。我想我可以在每次动画更新时
将
数据
写入文件,但我很好奇别人是如何做到这一点的。
浏览 11
提问于2020-08-22
得票数 0
1
回答
OpenAI
-Gym中的定制环境
、
、
可能我想使用
时间
序列
数据
在这(但不像股票)。我想让我的系统按照
时间
来学习行为,给出一个环境。 所以我首先要做一个定制的环境,有人能帮我吗?
浏览 0
提问于2019-02-21
得票数 2
2
回答
与开放ai
健身房
/稳定基线的集成
开放人工智能
健身房
最有可能成为ML的基准测试标准,稳定基线算法是最受欢迎的ML库之一。有没有关于如何
将
Webots与
健身房
环境集成的指南,以便可以使用稳定的基线?
健身房
环境暴露了一些功能,比如step和reset,但是我不确定这些功能是如何用来控制webots的。如果有更多webots API/外部控制知识的人能够规划出集成的路径,我
将
非常感激-甚至为其他人写一份关于如何集成它的指南(如果还没有完成的话)?
浏览 2
提问于2020-01-17
得票数 0
1
回答
预测一个约翰明天什么时候去
健身房
?
、
、
、
我有一个
数据
集,其中包含以下列:John Monday 16:00 17:John Tuesday 14:00 14:42我需要一些关于如何预测约翰下一步什么时候去
健身房
的建议
浏览 0
提问于2019-05-01
得票数 0
2
回答
使用多个股票交易记录的
数据
集的强化学习?
、
、
、
、
我正在使用Python3.6/Tensorflow进行强化学习,并且我已经找到/调整了我自己的模型,以基于特定股票的历史
数据
进行训练。我的问题是,有没有可能在不止一个股票的
数据
集上训练这个模型?我读过的每一篇关于
时间
序列
预测和RL的机器学习文章都使用一个
数据
集进行训练和测试,但我的目标是在一堆不同价格的报价器上训练一个模型,希望该模型可以识别相似的价格模式,而不管价格或报价器,这样我就可以
将
训练好的模型应用到新的
数据
集上现在,它在一个报价器上训练,它
浏览 24
提问于2018-12-30
得票数 1
2
回答
策略梯度:为什么这与Adam而不是SGD趋同?
、
如果我运行它,它会在
OpenAI
健身房
卡特波尔-V0上收敛并获得很好的分数。 然而,如果我
将
优化器从Adam改为随机梯度下降(SGD),它永远不会收敛,而且似乎是随机的。为什么会这样呢?注意:该代码中有一个错误,它只运行了100个
时间
步骤。这一集可以持续200多个
时间
步骤。我在运行它的时候修好了这个。
浏览 0
提问于2018-09-17
得票数 3
1
回答
一个更大的动作空间是否需要更长的
时间
来训练一个RL特工?
、
我正在与
openai
健身房
玩,试图更好地理解强化学习。您可以修改的一个代理参数是动作空间,即代理可以在每个状态下在环境中采取的特定操作。在我的研究中,我没有发现有任何地方明确指出,如果操作空间更大,RL模型,特别是PPO2,
将
需要更长的
时间
来训练。同样的All,相同的
数据
,相同的环境,相同的超参数,相同的硬件,一个动作空间更大(更多可能的动作)的模型比一个动作空间更小的模型需要更长的
时间
吗?(例如,一个有100个可能行动的代理人训练一集比一个有两个可能行动的代理人花费更长的
时间<
浏览 0
提问于2019-07-24
得票数 1
回答已采纳
1
回答
多智能体强化学习环境公共交通问题
、
、
、
、
其想法是,巴士在给定的线路上运行,但没有
时间
表。公共汽车应该有公交车站,乘客们会随着
时间
的推移而聚集起来,巴士之间的间隔越长,乘客在车站等候的
时间
就会越长(平均而言,这是一个随机过程)。公共汽车可以选择加速、减速、在停车时等待更长
时间
或以正常速度继续行驶。是否有人建议适合哪种模拟环境?如果有可能把这个和现有的RL算法联系起来呢?我
浏览 6
提问于2020-09-23
得票数 1
0
回答
mxnet:
将
数组的元组列表保存到文件
、
、
、
、
我有一个简单的生成器,可以从游戏中的随机漫步中产生观察结果(来自
openai
健身房
):from mxnet import *我希望能够
将
这些
数据
保存到一个包含(observation, reward, action)
浏览 7
提问于2018-07-17
得票数 0
1
回答
如何
将
Q-学习应用到
OpenAI
-
健身房
环境中,在每个
时间
步骤中采取多种行动?
、
、
、
我已经成功地使用Q-学习解决了一些经典的
OpenAI
健身房
强化学习环境(即出租车,CartPole)。这些环境允许在每个
时间
步骤中执行单个操作。但是,我无法找到一种解决问题的方法,即在每个
时间
步骤同时采取多个操作。例如,在Roboschool环境中,必须在每个
时间
步骤中指定两个扭矩值--每个轴一个。问题是,Q矩阵是由(状态,动作)对构建的。为了支持这种情况,Gym定义了一个特殊的容器类,它允许
将
多个操作空间嵌套为一个统一的操作。 有没有人知道如何处理Q学习中的多个动作?
浏览 0
提问于2019-04-05
得票数 4
0
回答
如何在R中将带日期列的time.series对象写入excel文件?
、
、
有几个函数可以
将
data.frames写到excel中,例如来自xlsx包的write.xls。但是,当我编写
时间
序列
时,它会使用行名1、2、3、..保存
数据
。而不是日期。如何
将
日期
保存为
行名?
浏览 7
提问于2016-07-13
得票数 1
回答已采纳
2
回答
INSERT语句与外键约束冲突“
、
、
我正在尝试
将
数据
插入我的Server 2014构建中,并且一直收到这个错误。我试着在互联网上搜索,在我的whits末端,我知道人们在说什么,但仍然很难理解我的特定代码有什么问题。没有
数据
的所有表都是空的。设置外键后,我无法添加
数据
。我读到两个表都必须填充才能工作,但是当我不能添加任何内容时,这是如何发生的呢?如果在外键之前添加
数据
,则无法添加外键。请帮帮我!当尝试使用insert into
将
数据
插入到Gym行时,我得到以下错误: INSERT语句与外键约束"
浏览 0
提问于2015-12-08
得票数 0
回答已采纳
1
回答
如何在InfluxDB中存储日期
我需要开发一个InfluxDB
时间
序列
。
时间
序列
需要包含以下信息: 我目前的思路是将上面的“日期”字段
保存为
时间
序列
中的一个单独的“列”,以便我可以使用&qu
浏览 4
提问于2015-02-18
得票数 4
1
回答
如何制作iPhone TimeTable应用程序
、
、
、
我想创建一个Iphone应用程序来查看我的
健身房
时间
表,我现在正在学习目标C。这是一个简单的应用程序来查看时刻表。界面是一个UITableView,带有标题(当天的
时间
)和静态的左侧行,显示一周中的日期,中间是
数据
(
健身房
课程信息),因此用户可以向右/向左和向上/向下滚动。我知道如何使用JSON
将
数据
加载到我的UITableView上,并且我遵循了来自但是我需要一些关于如何制作标题和左行的指导,我不知道从哪里开始。
浏览 0
提问于2012-04-20
得票数 0
回答已采纳
1
回答
竞赛策略发展的观察空间-强化学习
、
、
我
将
非常感谢任何链接,或给我一个起点,如何建模我的具体环境在一个观察空间。我的研究目标是确定RL在赛车运动战略发展中的可行性。这是目前通过模拟(很多!)比赛和计算不同战略决策的比赛
时间
(因此结束位置)(这是停站的
时间
+加油的圈数)。这就要求所有参与者都需要人工输入预期的内圈(一圈一停),这就间接地限制了人类想象的可能策略以及可能的模拟量。使用RL 经过训练的RL代理可以自行决定何时进行停站,以及应该添加多少燃料,以便缩短比赛
时间
,并对模拟中的概率事件作出反应。动作空间是离散的(4),代表的选择,继续,坑和加油分
浏览 5
提问于2021-08-24
得票数 0
1
回答
Firestore
时间
戳另存为地图
、
、
、
Tournament = {} 将此锦标赛对象传递给一个可调用的云函数,该函数的单独用途是
将
传递的tournament
保存为
文档,它会将start字段
保存为
具有seconds和miliseconds属性的映射,而不是Firestore中的
时间
戳。我也试着只做start: start,但这也不能带来在Firestore中保存
时间
戳的预期结果。
浏览 8
提问于2019-09-12
得票数 1
回答已采纳
1
回答
通过创建图像对象
将
图像保存到二进制
数据
中
、
、
、
、
在我的快速代码中,目标是
将
图像保存到核心
数据
中。我的代码现在不起作用。这不是合适的类型。如果代码是字符串,则代码可以工作,但试图将其保存到二进制
数据
中是行不通的。核心
数据
二进制被称为"pic“。
浏览 13
提问于2022-05-10
得票数 -2
3
回答
如何微调微调GitHub副驾驶?
、
、
、
、
我们可以微调语言模型,如BERT、GPT-3。我已经看过了的例子,但找不到细节。
浏览 26
提问于2022-06-09
得票数 1
回答已采纳
1
回答
数字列表的最有效(反)
序列
化
、
、
、
、
我目前使用将我的
数据
以Pair<double[], Double>格式保存到我计算机上的一个目录中。唯一要
序列
化的
数据
是数组形式的数值。我已经
将
超过5 am的原始数字
数据
保存到该目录中,并且我希望继续添加更多
数据
。我正在尝试使系统面向未来,以便更有效地存储
数据
(用于非常需要
数据
的神经网络)。有没有比
序列
化Pair<double[], Double>对象更好的存储
数据
的方法?我应该
将</
浏览 0
提问于2018-08-03
得票数 0
1
回答
用于有监督和/或无监督学习的
OpenAI
健身房
OpenAI
健身房
真正实现了强化学习方式的规范化。它使
数据
科学家能够
将
模型开发和环境设置/构建分开,并将重点放在他们真正应该关注的方面。引用健身网站的话: 背景:为什么
健身房
(2016)强化学习(RL)是与决策和运动控制相关的机器学习的子领域。它研究一个agent如何在复杂的、不确定的环境中学习如何实现目标。在监督学习中,ImageNet这样的大型标记
数据
集推动了学习的进程。在RL中,最接近的等效环境将是一个庞大而多样的环境集合。
健身房
是一种解决这两个问题的尝
浏览 0
提问于2021-03-06
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券