由MIT和IBM研究人员组成的团队开发的“ ObjectNet”是一个数据集,旨在解决现实世界对象的复杂性。
与ImageNet利用Flickr和其他在线资源拍摄的图片不同,ObjectNet使用自由职业者拍摄的图片。ObjectNet具有一种新型的视觉数据集,它借鉴了其他科学领域的控制思想。它甚至没有训练集,仅提供测试集以加快流程。在ObjectNet中收集的图像有意地在新背景上从不同的角度显示对象。样本大小为50,000个图像测试集,与ImageNet相同,具有高级功能,例如旋转,背景和视点控件。它具有313个对象类和113个重叠的ImageNet。
虽然一些领先的物体检测模型在ObjectNet上进行了测试,但其准确率从ImageNet上的97%的高位下降到了50-55%。
论文:
https://objectnet.dev/objectnet-a-large-scale-bias-control-dataset-for-pushing-the-limits-of-object-recognition-models.pdf
下载数据集:
https://objectnet.dev/download.html
API:
https://github.com/dmayo/ObjectNet-API
数据集构建
对人类容易,对机器很难