我正在尝试使用预训练的BERT模型进行文本分类。我在我的数据集上训练了模型,并在测试阶段;我知道BERT只能接受512个令牌,所以我编写了if条件来检查我的数据帧中测试的长度。序列的长度是512,但是在执行tokenize编码之后,长度变成了707,我得到了这个错误。The size of tensor a (707) must match the size of
,其中bert之后的最终分类器长度为281。如何从ClinicalBert模型加载预训练的Bert权重,而不加载分类权重?天真地尝试从预先训练的ClinicalBert权重中加载权重时,我得到了以下错误: size mismatch for classifier.weight: copying a param with shape我得到了以下错误信息: INFO - modeling_diagnosis - BertForMultiL