我不仅要利用特征提取器预训练的权重,还要利用特征映射层的分类器/本地化预训练权重,使用tensorflow对象检测API ( tensorflow object Pre)对tensorflow对象检测模型(SSD)进行微调。当我的新模型与我用于微调检查点的预训练模型有不同数量的类时,TensorFlow对象检测API将如何处理分类权重张量?
当在像SSD这样的ML对象检测模型中微调预训练模型时,我不仅可以用预先训练的权重初始化特征提取器的权重,而且可以初始化特征地图的定位层权重和分类层权重,后者只选择选择的预训练类权重,这样我就可以减少模型最初能够识别的类数(例如,从90层MSCOCO类到这90类中的任意类,比如汽车和行人类等等)。
这是在keras模型(即h5文件中)中所做的,我也希望在Tensorflow对象检测API中也这样做。在培训时,我似乎可以指定配置原型文件中新模型将拥有的类数,但是由于我对API (和tensorflow)还不熟悉,所以我无法遵循源结构,也无法理解微调将如何处理这个数字。我知道的大多数SSD模型只是忽略并初始化了分类权张量,以防预训练模型的类权重形状不同于新模型的分类权重形状,但我希望保留必要的分类权重并对其进行训练。另外,我将如何在API结构中做到这一点?
谢谢!
发布于 2018-03-20 07:50:30
当我阅读代码时,我发现了负责任的代码,只有当新定义的模型和预先训练的模型之间的层次形状匹配时,它才保留预训练模型的权重。因此,如果改变类的数量,分类器层的形状就会发生变化,而预先训练过的权重就不会被保留。
https://stackoverflow.com/questions/49374984
复制相似问题