我为connect-4编写了一些AI代码。我想调整某些评估函数中的权重。我有有限的时间和硬件,所以我的问题是:在评估的质量方面,基于使用较低深度搜索获得的结果执行“训练”和调整权重是否非常糟糕,而不是当AI在有更多时间并因此可以在更深层次上搜索游戏树的情况下必须表现最佳时使用的结果?
发布于 2011-12-14 02:32:26
好吧,如果你的时间有限,你必须使用较低的深度搜索来调整权重。这与用于制作双陆棋等游戏的时间差分学习的想法非常相似。也就是说,您可能想要使用强化学习的思想。时间差分是强化学习的一种方式。
https://stackoverflow.com/questions/5377012
复制相似问题