前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Dataset - DeepFashion 服装数据集

Dataset - DeepFashion 服装数据集

作者头像
AIHGF
发布2019-02-18 10:02:37
3.7K0
发布2019-02-18 10:02:37
举报
文章被收录于专栏:AIUAI

Dataset - DeepFashion 服装数据集

[Dataset - DeepFashion]

[Project - DeepFashion]

对于数据集有学习科研等需求的,请在 AIUAI-Dataset - DeepFashion 服装数据集 中联系.

1. 服装类别和属性预测集

[Category - Attribute 下载]

[百度网盘]

这里写图片描述
这里写图片描述
  • 289,222 张服装图片 clothes images;
  • 50 个服装类别 clothing categories
  • 1,000 个服装属性 clothing attributes;
  • 每张图片都标注了 bounding box 和服装类型 clothing type.

1.1 数据文件说明

下载文件包括:

  • Img - 服装图片文件夹 共 289,222 张图片,JPG 格式. 图片的最长边 resize 到 300,保持原始图片的长宽比 aspect ratios.
  • list_bbox.txt - 服装 bbox 标注 bbox 标注: [x1, y1, x2, y2],[x1, y1] 左上角位置,[x2, y2] 右下角坐标.
  • list_category_cloth.txt - 服装类别 Category (50 类) 分为上身服装、下身服装、全身服装三类,其 ID 分别为 1,2,3. 服装类别根据其顺序依次表示. 服装类别Category预测问题可以看做是 1-of-K 分类问题.
  • list_category_img.txt - 服装类别 Category 标注
  • list_attr_cloth.txt - 服装属性 Attribute (1000 种) 服装属性Attribute类型包括五类:纹理-Texture,面料-Fabric,形状-Shape,部分-Part 和风格-Style,其 ID 分别为 1,2,3,4,5.
  • list_attr_img.txt - 服装属性 Attribute 标注 服装属性标注信息,是 1000 维的向量,每维分别表示是否存在某服装属性Attribute,1 表示存在,-1 表示不存在,0 表示未知Unknown. 服装属性Attribute预测问题可以看做是多标签标注 Multi-label Tagging问题.
  • list_eval_partition.txt - 服装图片数据集的划分 train - 训练图片集;val - 验证Validation图片集;test - 测试图片集.

1.1 服装类别Category

50 category_name category_type Anorak 1 带风帽的厚茄克;防水布;滑雪衫 Blazer 1 运动夹克,运动上衣 Blouse 1 短上衣;女衬衫;宽松的上衣;工装 Bomber 1 Bomber Jacket 飞行员夹克 Button-Down 1 (衬衫)领尖有纽扣的,纽扣领的 Cardigan 1 开襟羊毛衫 Flannel 1 法兰绒衣服;法兰绒,绒布;毛巾; Halter 1 吊带 Henley 1 亨利 Hoodie 1 连帽衫;带帽夹克; Jacket 1 短上衣,夹克 Jersey 1 针织 Parka 1 风雪大衣;派克大衣 Peacoat 1 水手穿的厚呢短大衣 Poncho 1 斗篷 Sweater 1 毛衣,运动衫 Tank 1 tank top 背心装 Tee 1 T恤;短袖圆领运动衫(等于T-shirt) Top 1 上衣 Turtleneck 1 高领绒衣;高翻领,圆翻领 Capris 2 女用紧身裤 Chinos 2 斜纹棉布裤 Culottes 2 女裙裤 Cutoffs 2 拼接款 Gauchos 2 南美牛仔 Jeans 2 牛仔裤;粗斜纹棉布裤 Jeggings 2 牛仔样式打底紧身裤;是jeans(牛仔裤)和leggings(打底紧身裤)两个词的合成词; Jodhpurs 2 骑马裤,短马靴 Joggers 2 慢跑裤 Leggings 2 (女式)紧身裤 Sarong 2 马来群岛土人所穿的围裙,布裙 Shorts 2 短裤 Skirt 2 裙子;边缘;(连衣裙、外衣等的)下摆 Sweatpants 2 运动裤 Sweatshorts 2 Trunks 2 (男式)游泳裤 Caftan 3 有腰带的长袖衣服 Cape 3 披肩;斗篷 Coat 3 上衣,外套 Coverup 3 Dress 3 连衣裙 Jumpsuit 3 连衣裤,(尤指女式)连衣裤 Kaftan 3 土耳其式长衫 Kimono 3 (日本的)和服;和服式女晨衣 Nightdress 3 (妇女或孩子穿的)睡衣,睡袍 Onesie 3 连身衣 Robe 3 长袍;罩袍; 浴袍;睡袍 Romper 3 背心连裤子的衣服 Shirtdress 3 (上身像衬衫的)衬衣式连衣裙 Sundress 3 太阳裙,背心裙

实际上应该只有 46 类服装类别:

[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 46, 47, 48]

每类服装有的图片数:

[160, 7495, 24557, 309, 330, 13311, 324, 17, 716, 4048, 10467, 748, 676, 97, 791, 13123, 15429, 36887, 10078, 146, 77, 527, 486, 1669, 49, 7076, 594, 45, 4416, 5013, 32, 19666, 14773, 3048, 1106, 386, 54, 2120, 17, 72158, 6153, 126, 2294, 70, 150, 7408]

可视化:

代码语言:javascript
复制
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

datas = open('list_category_img.txt').readlines()[2:]
print 'Num of DeepFashion Category Images: ', len(datas)

ann_labels = [eval(data.split(' ')[-1].strip()) for data in datas]
category_labels = np.unique(ann_labels)
print 'Num of DeepFashion Category: ', len(category_labels)

label_counts = [ann_labels.count(label_temp) for label_temp in category_labels]
print 'Num of DeepFashion Each Category Images: ', label_counts


plt.figure(figsize = (12,6))                                      
sns.barplot(category_labels, label_counts, alpha = 0.9)
plt.xticks(rotation = 'vertical')
plt.xlabel('Image Labels', fontsize =12)
plt.ylabel('Counts', fontsize = 12)
plt.show()
这里写图片描述
这里写图片描述

2. 服装关键点检测数据集

[Fashion Landmark 下载]

[百度网盘]

这里写图片描述
这里写图片描述
  • 123,016clothes images;
  • 每张服装图片标注了8个服装关键点 fashion landmarks,包括关键点位置location 和可见性visibility;
  • 每张图片也标注了 bounding box, 服装类型clothing typevariation type.

2.1 数据文件说明

下载文件包括:

  • Img - 服装图片文件夹 共 123,016 张图片,JPG 格式. 图片的最长边 resize 到 512,保持原始图片的长宽比 aspect ratios.
  • list_bbox.txt - 服装 bbox 标注 bbox 标注: [x1, y1, x2, y2],[x1, y1] 左上角位置,[x2, y2] 右下角坐标.
  • list_landmarks.txt - 服装关键点标注 每一行的标注内容格式: image name clothes type variation type [landmark visibility 1 landmark location x_1 landmark location y_1, … landmark visibility 8 landmark location x_8 landmark location y_8] 服装类型有三类:上身服装、下身服装、全身服装,其 ID 分别为 1,2,3. 上身服装共 6 个关键点,依次为:[“left collar”, “right collar”, “left sleeve”, “right sleeve”, “left hem”, “right hem”]; 下身服装共 4 个关键点,依次为:[“left waistline”, “right waistline”, “left hem”, “right hem”]; 全身服装共 8 个关键点,依次为:[“left collar”, “right collar”, “left sleeve”, “right sleeve”, “left waistline”, “right waistline”, “left hem”, “right hem”].
  • list_eval_partition.txt - 服装图片数据集的划分 train - 训练图片集;val - 验证Validation图片集;test - 测试图片集

Related

[1] - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

[2] - Fashion Landmark Detection in the Wild

[3] - 论文阅读理解 - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年02月27日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Dataset - DeepFashion 服装数据集
    • 1. 服装类别和属性预测集
      • 1.1 数据文件说明
      • 1.1 服装类别Category
    • 2. 服装关键点检测数据集
      • 2.1 数据文件说明
    • Related
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档