对于雅达利游戏,在A2C中是否默认使用“循环策略”?我发现很难理解他们高度工程化的代码。
发布于 2019-03-19 09:56:59
你的意思是他们在A2C中是否默认使用递归神经网络?如果是这样,答案是否定的。他们默认使用《自然》杂志上的CNN。它有点复杂,但这个blog post在解释代码方面做得很好。
https://stackoverflow.com/questions/54413119
相似问题