我正在寻找一篇参考论文,在那里我可以发现迁移学习需要来自领域特定的源模型,而不是使用泛化模型,即imagenet
例如,源数据集植物的卫星/无人机超/多光谱图像和使用农业机器人捕获的植物的超/多光谱图像的目标数据集
相比于
使用农业机器人捕获的植物的源数据集ImageNet模型和目标数据集图像
发布于 2020-01-27 18:30:34
如果你没有足够的数据,迁移学习在准确性方面特别有趣。例如,this paper在imagenet上比较了有和没有预训练的训练。他们声称,在10k图像之后,预训练不会提供更好的结果,但仍然可以更快地训练。
然后,如果你有一个小的数据集,你的问题仍然存在,你应该在imagenet上进行预训练还是在另一个数据集上进行预训练。我认为这个问题的答案在下面的段落中给出了(这里的参考资料可能会让你感兴趣):
我们需要大数据吗?需要。但是,如果我们考虑到收集和清理数据的额外努力,通用的大规模分类级别的预训练集并不理想-收集ImageNet的成本在很大程度上被忽略了,但当我们扩展这种范式时,“预训练+微调”范式中的“预训练”步骤实际上并不是免费的。如果大规模分类级预训练的增益成指数级递减44,30,则在目标领域收集数据将更有效。
因此,您还需要考虑卫星图像数据集的质量。因为它应该比Imagenet更接近您的数据,所以它可能更好。
https://stackoverflow.com/questions/59928877
复制相似问题