首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >深度强化学习

深度强化学习
EN

Stack Overflow用户
提问于 2020-03-19 08:30:13
回答 1查看 72关注 0票数 0

我正在使用一种深度强化学习方法来导航一个agent从一个初始点到一个目标点。现场还有其他因素和障碍。

第一个问题是输入的神经网络。

Τhese是我在最初的场景中知道的元素:

其他障碍物agent.

  • Position的
  1. 位置和初始速度

在其他情况下,我读到神经网络的输入是图像(可能是传感器),但在我的例子中,我不想使用视觉传感器。

2.在强化学习算法中,数据集不是预生成的,而是在训练时对数据进行模拟。

我没有找到如何创建dataset,如何使用我前面提到的3个元素。

有人能帮帮我吗!提前谢谢!

EN

回答 1

Stack Overflow用户

发布于 2020-08-06 05:47:17

神经网络的

  1. 输入:可以是您认为有助于agent做出决策的任何特性

  1. 您可以通过为每个动作生成奖励来模拟数据。奖励可以是正的,也可以是负的,它将作为神经网络的目标。经过多次培训后,你的经纪人将学会以高回报采取行动。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60753419

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档