前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SBD数据集

SBD数据集

作者头像
狼啸风云
修改2022-09-03 19:43:39
1.7K0
修改2022-09-03 19:43:39
举报

数据集下载在百度云盘:链接:https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码:jgx7

里面的benchmark,表示SBD数据集

dataset包含以下:

train.txt 8498行图像的名字索引

val.txt 2857行图像的名字索引

img文件夹,里面11355全是jpg图像文件(隶属于voc的JPEGImage文件夹下的17125张jpg图像)

cls文件夹, 里面11355全是mat文件

inst文件夹, 里面11355全是mat文件

sbd数据属于voc2012数据集,但是voc数据集的训练或者验证图片的标签图非常少。但是sbd给出的很多,所以可以综合这两个数据集得到更加多的验证集和数据集标签。

下面给出的一些数据:

voc数据集标签:

voc_trainval:2913 voc_train:1464 voc_ val:1449

sbd数据集标签:

sbd_train:8498 sbd_val:2857

因此可以得到增强版的数据集标签:

train_aug = voc_trian + sbd_train - 重复的图片 8829

train_aug_val = voc_val - sbd_train(就是剔除掉已经是trian_aug里面的图片) 904

上面两个就是常见的扩增数据集,总共有9733张标注图。

但是我们注意到sbd也有val集合,所以标注图像可以继续进行扩增:

val_aug = voc_val + sbd_val - 重复的图片 - train_aug 3202

所以train_aug和val_aug两个加起来就是最大的扩充数据集,总共有12031张标注图。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-11-24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档