我使用了Huggingface中的以下分类模型:据我所知,这增加了一个密集的一层结束前训练的模型,其中有两个输出节点。但是在那之前所有的预训练层都被冻结了吗?或者它们在微调时也是更新的?我在文档里找不到这方面的信息..。for param in model.bert.parameters():
param.re
在10K句子的数据集上训练后,我保存的模型的.index、.meta和.data文件的大小分别为3KB、58MB和375MB 在保持网络体系结构不变的情况下,在100K句子的数据集上进行训练,文件大小分别为3KB、139MB和860MB 我认为这表明大小取决于数据集的大小。According to this answer,文件的大小应该独立于数据集的大小,因为神经网络的体系结构是相同的。 为什么在尺寸上有如此巨大的差异? 我还想知道除了链接答案中提到的文件之外,这些文件还包含哪些内容。 这些文件是否包含与训练历史相关的信息,如每一步的损失值等?