我最近开始研究目标检测算法。我经常遇到这样的模型,其基础网络是LeNet或PVA-Net,然后是用于检测的不同架构或模型。但是我从来没有理解过这些基础网络和检测网络是如何帮助的,以及如何选择特定的模型作为基础网络或检测网络?
发布于 2019-04-30 16:23:46
假设您正在构建一个用于对象检测的模型。
CNN对象检测模型(为了简单起见,让我们选择SSD)可以由用作特征提取的基本网络组成,而检测模块获取输入特征(从基本网络提取)以生成包含对象类的输出,以及检测到的对象的坐标(包括预测框的中心(x,y)、高度(h)和宽度(w) )。
对于基本网络,我们通常采用预先训练好的网络,如ResNet
,VGG
等,这些网络已经在像ImageNet
这样的大型数据集上进行了训练,希望基本网络能够为检测层产生一组良好的特征(或者至少我们不需要在训练过程中调整太多的基本网络参数,这有助于模型很快收敛)。
对于检测模块,这取决于您要使用哪种方法,例如,一阶段方法(SSD、RetinaNet、YOLO等)或两阶段方法(更快的R-CNN、掩模R-CNN等)。这些方法之间的准确性和速度之间存在权衡,这是您应该选择哪个检测模块的重要指标。
https://stackoverflow.com/questions/55916508
复制相似问题