我试图在KITTI数据集上训练任何物体探测器,它有一个奇怪的纵横比~370高和1240宽。我无法得到良好的检测后,开始微调任何一个模型动物园。我使用了示例coco吐露,简单地将图像大小参数更改为输入图像大小,并将类数更改为4。
我首先按照本教程中的指示创建数据集的TFRecord文件,并检查该文件以确认图像、标签和其他信息已正确保存到二进制格式中,因此数据集没有问题。
当我和动物园里的模特们一起评估时,我得到了很好的检测。然而,一旦我试着对我自己训练过的模型进行评估,检测结果就会很糟糕,而且图像上到处都是。在训练期间,ssd ~4和rfcn ~.0004的损失也非常低。我认为这与图像大小有关,但我不确定。有人知道为什么在新的数据集上检测结果会如此糟糕吗?
下面是我从ssd模型中得到的包围框类型的示例:
实例检测
发布于 2017-10-26 04:27:31
我的问题是TFRecord文件。包围盒、坐标和标签有错误的键,所以网络被训练成“空”图像,没有边界框。这也解释了为什么我的错误收敛到0,因为网络的权重只是被正则化压扁,从定位到形成梯度没有损失。
https://stackoverflow.com/questions/46944189
复制相似问题