我现在正在做一个多层的一维CNN节目。最近,我把工作转移到了一台HPC服务器上,对CPU和GPU (NVIDIA)进行了培训。
我的代码在我自己的笔记本上用TensorFlow 2.7.3运行得很漂亮(虽然缓慢)。我使用的HPC服务器安装了一个更新版本的python (3.9.0)和TensorFlow。
我的问题是: Keras回调函数“早期停止”不再像在服务器上那样工作了。如果我将耐心设置为5,那么它将只运行5次,尽管在model.fit()中指定了epochs = 50。似乎该函数假设第一个时代的val_loss是最低值,然后从那里运行。
我不知道怎么解决这个问题。在我自己的笔记本电脑上,这个功能将在15个时节达到最低的val_loss,并运行到20个历代。在服务器上,训练时间和时间是不够的,在测试数据集上的准确率很低(~40%)。
请帮帮忙。
发布于 2022-08-05 06:04:42
由于某种原因,在model.fit()中将我的EarlyStopping从16减少到8,使得EarlyStopping回调正常工作。我不知道这是为什么。但现在起作用了。
https://stackoverflow.com/questions/73201539
复制相似问题