我正在从中心裁剪文档图像。我使用了VGG网络的预训练模型,并从最后一卷积层的图像中提取特征。
我还从图像中获得了所有可能的边界框,也得到了地面真实边界框。
详情如下:共25张图片(演示用)
特征图大小:(25,512,14,14)
所有边界框大小:(25,)。一个图像有55167个边界框,因此(55167,4) (这在某些图像中是不同的)
真实边界框:(25,4)
现在,我如何在网络中提供这些信息?
我还查阅了一些论文和资源。我不需要分类层,我只想要框坐标作为结果。
我正在使用keras库。
发布于 2017-09-14 20:53:25
您应该考虑使用本地化网络,而不仅仅是分类。This repository还支持两个阶段的培训,为您节省一些培训时间。
https://stackoverflow.com/questions/46196178
复制相似问题