开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在强化学习中，智能体是否需要预先知道奖励函数？

问在强化学习中，智能体是否需要预先知道奖励函数？
EN

Stack Overflow用户

提问于 2019-12-08 15:20:01

回答 1查看 151关注 0票数 0

就像Q学习一样，我们有奖励反馈，这是否意味着代理需要提前知道？

machine-learning

reinforcement-learning

EN

回答 1

Stack Overflow用户

发布于 2019-12-11 00:19:39

代理不需要具有关于奖励功能的知识。但它每走一步都应该得到奖励。请注意，在这一集结束之前，我们可以没有奖励。术语奖励反馈意味着每个转换都有一定的标量值。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59233299

复制

相似问题