问深度Q-学习Agent性能在一定时期后会下降。
EN

Stack Overflow用户

提问于 2019-01-13 18:05:54

回答 1查看 512关注 0票数 0

我有一个DQN代理，它在一个特定的网络上被训练来执行一个任务。然而，在训练代理时，我注意到，在初始的几个时期之后，当代理的得分显示出总体增长后，代理的性能突然出现了急剧下降，就好像它正在重新开始一样。这种情况经常发生。

i代理显示性能从差到好的波动，对于DQN代理来说是正常的。我应该做什么诊断才能消除这种波动？我曾为代理商使用过经验回放和探索-开发。我对这个领域还比较陌生，所以这个问题可能是相当微不足道的。

回答已采纳

发布于 2019-01-14 12:10:09

这些波动在达到最佳水平之前是正常的。在大多数的加固试验和文献中，用window size of 15-30加权平均法对结果进行了分析。下面是我的dqn实现的图表。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54171713

复制

相似问题

问深度Q-学习Agent性能在一定时期后会下降。EN