以R-CNN为例。我知道有一个区域建议网络,然后是一个单独的分类网络,一般的想法是它找到可能是对象的潜在区域,然后将这些区域传递给分类器,以找出它是什么。我想知道如果我有一个自定义的数据集,分类器是如何训练的。它是否简单地提取所有边界框,使用这些边界框坐标创建新图像,对其进行预处理,然后使用它们进行训练?
换句话说,目标检测模型中使用的分类器是在基于边界框坐标生成的图像上训练的,还是更复杂?
发布于 2020-08-03 12:48:12
基于我对你的问题的理解:“你想了解分类器网络是如何工作的吗?”
当我们设计一个检测器网络和一个分类器网络时,这两个网络都是在训练数据集上对不同类型的网络进行训练。例如,您希望检测不同类别的车辆,如卡车、公共汽车、面包车、小汽车、自行车等。
因此,在检测器网络之后测试整个管道(检测器+分类器)时,您将根据场景中存在的车辆数量获得多个边界框。在此之后,您需要将所有这些裁剪的边界框图像调整到相同的尺寸,并逐个提供给分类器网络。例如,一个场景可能有5辆车,那么分类器将分别接收5辆车的图像。您还需要保留馈送的裁剪图像的坐标,以在结果上标记车辆的类别和位置。
https://stackoverflow.com/questions/63223630
复制相似问题