使用照片拼贴(一张图像中的多张照片)作为数据集,而不是使用单个图像来训练对象检测SSD模型是否正常/更好?
我正在使用Tensorflow对象检测API来建立一个SSD模型来识别和检测不同的叶子疾病。我的数据集由256x256树叶(植物村数据集)组成,我希望我的模型能够被训练来检测多个不同大小的对象(大多数叶子几乎和图像本身一样大--这给小对象带来了不好的准确性),所以我考虑将这些图片组合到拼贴图中,在每张图片中包含几个叶子,并用以下方式创建一个数据集,对于每个标签,我将使用单个叶图像、4个叶图像(2x2拼贴)和9个图像(3x3拼贴)。你认为它会给多目标检测提供更好的结果吗?还是应该停留在单一图像上,而不会改变任何事情?如果它有效,您建议为图像调整大小选项设置什么?它应该像300x300那样低,还是因为在某个部分有9张图像,所以最好有800x800呢?
https://datascience.stackexchange.com/questions/80546
复制相似问题