我目前正在尝试用C++编写一个扮演炸弹人的人工智能,我想用CNTK将其实现为神经网络(强化学习)。该工具包有很多教程和示例,甚至有一个用于强化学习,但它是用python编写的,我不知道。有没有使用CNTK教授强化学习的实用C++示例或教程?
我最关心的第一个问题是如何使用CNTK C++ api创建模型。
由于观察不能揭示整个状态,我需要使用递归神经网络进行强化,以便网络对过去发生的事情有某种记忆。为简单起见,我们假设使用LSTM。现在,内置的shape LSTM需要向它提供shape Time x MiniBatch x Input D的一个PyTorch输入,它输出shape Time x MiniBatch x OutputD的张量。然而,在强化学习中,要知道time t+1的输入,我需要知道time t的输出,