openAI健身房将数据保存为时间序列

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

openAI健身房环境能够将结果打印到屏幕上，还可以渲染视频。是否有现有的命令或包装器/监视器来保存状态和操作的时间序列数据？我想在时频域中分析它的性能。我想我可以在每次动画更新时将数据写入文件，但我很好奇别人是如何做到这一点的。

浏览 11提问于2020-08-22得票数 0

1回答

OpenAI-Gym中的定制环境

、、

可能我想使用时间序列数据在这(但不像股票)。我想让我的系统按照时间来学习行为，给出一个环境。所以我首先要做一个定制的环境，有人能帮我吗？

浏览 0提问于2019-02-21得票数 2

2回答

开放人工智能健身房最有可能成为ML的基准测试标准，稳定基线算法是最受欢迎的ML库之一。有没有关于如何将Webots与健身房环境集成的指南，以便可以使用稳定的基线？健身房环境暴露了一些功能，比如step和reset，但是我不确定这些功能是如何用来控制webots的。如果有更多webots API/外部控制知识的人能够规划出集成的路径，我将非常感激-甚至为其他人写一份关于如何集成它的指南(如果还没有完成的话)？

浏览 2提问于2020-01-17得票数 0

1回答

预测一个约翰明天什么时候去健身房？

、、、

我有一个数据集，其中包含以下列：John Monday 16:00 17:John Tuesday 14:00 14:42我需要一些关于如何预测约翰下一步什么时候去健身房的建议

浏览 0提问于2019-05-01得票数 0

2回答

使用多个股票交易记录的数据集的强化学习？

、、、、

我正在使用Python3.6/Tensorflow进行强化学习，并且我已经找到/调整了我自己的模型，以基于特定股票的历史数据进行训练。我的问题是，有没有可能在不止一个股票的数据集上训练这个模型？我读过的每一篇关于时间序列预测和RL的机器学习文章都使用一个数据集进行训练和测试，但我的目标是在一堆不同价格的报价器上训练一个模型，希望该模型可以识别相似的价格模式，而不管价格或报价器，这样我就可以将训练好的模型应用到新的数据集上现在，它在一个报价器上训练，它

浏览 24提问于2018-12-30得票数 1

2回答

策略梯度:为什么这与Adam而不是SGD趋同？

、

如果我运行它，它会在OpenAI健身房卡特波尔-V0上收敛并获得很好的分数。然而，如果我将优化器从Adam改为随机梯度下降(SGD)，它永远不会收敛，而且似乎是随机的。为什么会这样呢？注意:该代码中有一个错误，它只运行了100个时间步骤。这一集可以持续200多个时间步骤。我在运行它的时候修好了这个。

浏览 0提问于2018-09-17得票数 3

1回答

一个更大的动作空间是否需要更长的时间来训练一个RL特工？

、

我正在与openai健身房玩，试图更好地理解强化学习。您可以修改的一个代理参数是动作空间，即代理可以在每个状态下在环境中采取的特定操作。在我的研究中，我没有发现有任何地方明确指出，如果操作空间更大，RL模型，特别是PPO2，将需要更长的时间来训练。同样的All，相同的数据，相同的环境，相同的超参数，相同的硬件，一个动作空间更大(更多可能的动作)的模型比一个动作空间更小的模型需要更长的时间吗？(例如，一个有100个可能行动的代理人训练一集比一个有两个可能行动的代理人花费更长的时间<

浏览 0提问于2019-07-24得票数 1

回答已采纳

1回答

多智能体强化学习环境公共交通问题

、、、、

其想法是，巴士在给定的线路上运行，但没有时间表。公共汽车应该有公交车站，乘客们会随着时间的推移而聚集起来，巴士之间的间隔越长，乘客在车站等候的时间就会越长(平均而言，这是一个随机过程)。公共汽车可以选择加速、减速、在停车时等待更长时间或以正常速度继续行驶。是否有人建议适合哪种模拟环境？如果有可能把这个和现有的RL算法联系起来呢？我

浏览 6提问于2020-09-23得票数 1

0回答

mxnet:将数组的元组列表保存到文件

、、、、

我有一个简单的生成器，可以从游戏中的随机漫步中产生观察结果(来自openai健身房)：from mxnet import *我希望能够将这些数据保存到一个包含(observation, reward, action)

浏览 7提问于2018-07-17得票数 0

1回答

如何将Q-学习应用到OpenAI-健身房环境中，在每个时间步骤中采取多种行动？

、、、

我已经成功地使用Q-学习解决了一些经典的OpenAI健身房强化学习环境(即出租车，CartPole)。这些环境允许在每个时间步骤中执行单个操作。但是，我无法找到一种解决问题的方法，即在每个时间步骤同时采取多个操作。例如，在Roboschool环境中，必须在每个时间步骤中指定两个扭矩值--每个轴一个。问题是，Q矩阵是由(状态，动作)对构建的。为了支持这种情况，Gym定义了一个特殊的容器类，它允许将多个操作空间嵌套为一个统一的操作。有没有人知道如何处理Q学习中的多个动作？

浏览 0提问于2019-04-05得票数 4

0回答

如何在R中将带日期列的time.series对象写入excel文件？

、、

有几个函数可以将data.frames写到excel中，例如来自xlsx包的write.xls。但是，当我编写时间序列时，它会使用行名1、2、3、..保存数据。而不是日期。如何将日期保存为行名？

浏览 7提问于2016-07-13得票数 1

回答已采纳

2回答

INSERT语句与外键约束冲突“

、、

我正在尝试将数据插入我的Server 2014构建中，并且一直收到这个错误。我试着在互联网上搜索，在我的whits末端，我知道人们在说什么，但仍然很难理解我的特定代码有什么问题。没有数据的所有表都是空的。设置外键后，我无法添加数据。我读到两个表都必须填充才能工作，但是当我不能添加任何内容时，这是如何发生的呢？如果在外键之前添加数据，则无法添加外键。请帮帮我！当尝试使用insert into将数据插入到Gym行时，我得到以下错误： INSERT语句与外键约束"

浏览 0提问于2015-12-08得票数 0

回答已采纳

1回答

如何在InfluxDB中存储日期

我需要开发一个InfluxDB时间序列。时间序列需要包含以下信息：我目前的思路是将上面的“日期”字段保存为时间序列中的一个单独的“列”，以便我可以使用&qu

浏览 4提问于2015-02-18得票数 4

1回答

如何制作iPhone TimeTable应用程序

、、、

我想创建一个Iphone应用程序来查看我的健身房时间表，我现在正在学习目标C。这是一个简单的应用程序来查看时刻表。界面是一个UITableView，带有标题(当天的时间)和静态的左侧行，显示一周中的日期，中间是数据(健身房课程信息)，因此用户可以向右/向左和向上/向下滚动。我知道如何使用JSON将数据加载到我的UITableView上，并且我遵循了来自但是我需要一些关于如何制作标题和左行的指导，我不知道从哪里开始。

浏览 0提问于2012-04-20得票数 0

回答已采纳

1回答

竞赛策略发展的观察空间-强化学习

、、

我将非常感谢任何链接，或给我一个起点，如何建模我的具体环境在一个观察空间。我的研究目标是确定RL在赛车运动战略发展中的可行性。这是目前通过模拟(很多！)比赛和计算不同战略决策的比赛时间(因此结束位置)(这是停站的时间+加油的圈数)。这就要求所有参与者都需要人工输入预期的内圈(一圈一停)，这就间接地限制了人类想象的可能策略以及可能的模拟量。使用RL 经过训练的RL代理可以自行决定何时进行停站，以及应该添加多少燃料，以便缩短比赛时间，并对模拟中的概率事件作出反应。动作空间是离散的(4)，代表的选择，继续，坑和加油分

浏览 5提问于2021-08-24得票数 0

1回答

Firestore时间戳另存为地图

、、、

Tournament = {} 将此锦标赛对象传递给一个可调用的云函数，该函数的单独用途是将传递的tournament保存为文档，它会将start字段保存为具有seconds和miliseconds属性的映射，而不是Firestore中的时间戳。我也试着只做start: start，但这也不能带来在Firestore中保存时间戳的预期结果。

浏览 8提问于2019-09-12得票数 1

回答已采纳

1回答

通过创建图像对象将图像保存到二进制数据中

、、、、

在我的快速代码中，目标是将图像保存到核心数据中。我的代码现在不起作用。这不是合适的类型。如果代码是字符串，则代码可以工作，但试图将其保存到二进制数据中是行不通的。核心数据二进制被称为"pic“。

浏览 13提问于2022-05-10得票数 -2

3回答

如何微调微调GitHub副驾驶？

、、、、

我们可以微调语言模型，如BERT、GPT-3。我已经看过了的例子，但找不到细节。

浏览 26提问于2022-06-09得票数 1

回答已采纳

1回答

数字列表的最有效(反)序列化

、、、、

我目前使用将我的数据以Pair<double[], Double>格式保存到我计算机上的一个目录中。唯一要序列化的数据是数组形式的数值。我已经将超过5 am的原始数字数据保存到该目录中，并且我希望继续添加更多数据。我正在尝试使系统面向未来，以便更有效地存储数据(用于非常需要数据的神经网络)。有没有比序列化Pair<double[], Double>对象更好的存储数据的方法？我应该将</

浏览 0提问于2018-08-03得票数 0

1回答

用于有监督和/或无监督学习的OpenAI健身房

OpenAI健身房真正实现了强化学习方式的规范化。它使数据科学家能够将模型开发和环境设置/构建分开，并将重点放在他们真正应该关注的方面。引用健身网站的话：背景:为什么健身房(2016)强化学习(RL)是与决策和运动控制相关的机器学习的子领域。它研究一个agent如何在复杂的、不确定的环境中学习如何实现目标。在监督学习中，ImageNet这样的大型标记数据集推动了学习的进程。在RL中，最接近的等效环境将是一个庞大而多样的环境集合。健身房是一种解决这两个问题的尝

浏览 0提问于2021-03-06得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云