机器视觉中的图像识别问题,常常需要大量的数据,而带标签的数据需要人工标注,很难得到较多的数据。因此,我们需要使用图像扩张的方法,人工生成各种变换后的数据,扩大我们的数据量,增强系统的鲁棒性,也是一种防止过拟合的方法。
图像扩张的非常常用变换有:
较常用:
图像扩张的手段,其实相对于让机器学习的模型能见识各种情况下的数据,增强它的鲁棒性。在我们人类看来可能觉得是同一个图像,但是机器觉得这就是不同的图像。
在具体编程实施,通常是开一个线程专门处理原始图像的变换,并形成一个mini-batch集,塞入到训练的过程中,这可以是并行的,不影响原来训练的顺序。