有两个不同的ImageNet数据集: ImageNet 1k通常在论文中称为ImageNet,完整的ImageNet数据集也称为ImageNet 22k。ImageNet 1k是22k的子集吗?如果是这样的话,1k类别在22k版本中是否以相同的方式表示,或者1k版本中某个类的图像是从22k版本中的几个不同类中聚合出来的(就像不同的狗品种被合并到“狗”类中一样)?我是否可以从22k版本中删除1k版本,并说除了1k版本之外,其余的22k版本是一个完全不同的数据集,甚至是1k版本的发布数据集?任何链接到一些受信任的来源将是很酷的。谢谢
发布于 2020-12-17 12:33:46
是的,完整的ImageNet是1k版本的超集(参见基准神经网络对常见腐蚀和扰动的鲁棒性)。1k同步集(即a.与1k版本相对应的类)也存在于完整的22k版本中。总共有21841个类,其中1000个与1k版本完全相同(图像完全相同),另外20841个类可以作为OOD处理1k版本数据集(至少在亨德里克斯等人,利用自监督学习可以提高模型的鲁棒性和不确定性。的一篇论文中是这样处理的)。
https://datascience.stackexchange.com/questions/86763
复制相似问题