我已经用minmax标量器规范了我的数据,并通过将一个列移到我创建的每个虚拟变量中来修正了这个虚拟变量陷阱。以下是我的培训数据的第一行: 0.13333333,, 0. ])from tensorflow.keras.models import Sequential
from tensorflow.keras.layersimport Den
现在,在训练步骤中,我必须多次调用predict()并使用结果来计算成本和训练模型。current_states_outputs[a][current_actions[a]] for a in range(len(current_actions))])
我在predict()上基本运行了会话,并使用普通的python方法完成了所需的操作但是,由于这切断了成本与图的前几层之间的联系,所以无法进行任何培训。所以,我需要做这个操作,保持在tensorflow中,并将一切保持为tensorflow</em