我对这种型号的批次大小感到困惑。我使用sgd,即随机梯度下降作为优化器(请参阅代码)。我知道在sgd中,使用训练集中的一个随机实例来计算每个步骤的梯度。因此,根据它,batch_size应该等于1。现在,在tf.keras.Sequential.fit()文档中,它说:
如果未指定,batch_size将默认为32。
那么,是否必须手动将batch_size设置为1?这是因为默认值32将使其成为最小批处理梯度下降.
import tensorflow as tf
from tensorflow import keras
fashion_mnist = keras.da