我想训练一个yolo模型来检测交通标志。我有非常大的图像(3840x2160)的整个街道的场景,包含1-3个较小的交通标志。我知道当模型在正方形和小图像上训练时效果最好。那么你认为用我给定的图像训练我的模型会有什么更好的做法呢?调整整个街道场景的大小并在整个图像上进行训练,还是从街道场景中提取交通标志并仅对标志进行训练?
谢谢你的帮助。
发布于 2020-09-16 21:22:22
你意外地将两种不同的深度学习方法交织在一起:当你只提取交通标志并对这些提取进行训练时,你实际上是在执行分类,而不是物体检测。
然而,Yolo是一种适合于目标检测的模型,它确实包括分类和定位。
我的建议是尝试较小的图像大小,并尽量保持宽高比(即将宽度和高度除以相同的数字),从而在整个图像上进行训练。
至于平方方法,您必须在自己身上进行测试,以检查模型的行为。
发布于 2020-09-17 04:23:44
我将首先尝试将您的图像调整为更合适的大小。你很可能不需要模型的全分辨率就能很好地满足你的用例。特别是对于sign detection with YOLOv5,我已经看到416x416
就足够了。
如果这在你的情况下不起作用,你也可以尝试平铺你的图像,一次对一小块进行推断。
有一篇关于其他strategies to detect small objects here的文章。
https://stackoverflow.com/questions/63916897
复制相似问题