标签格式示例说明

最近更新时间:2024-01-28 00:46:41

我的收藏

概述

当您需要在 TI 平台的 数据中心 > 数据集管理 模块上传一份“已标注”的“图片/文本”类型的数据集时,标注文件内容的格式需要遵循平台规范,只有符合规范的标注文件才可被后台正确解析,成功解析后您可在数据集详情页面查看该数据集的标注信息可视化分布展示。 且我们建议您单张图片的标注内容大小不超过100k,若需扩容,可通过工单联系我们哦。
在导入已标注的数据集时,请确认满足以下两点规范:
您需要按照“文件存放示意图”准备您的文件目录;
您需要参考“下载标注文件示例”链接中的内容格式准备您的标注文件。



以下详细介绍不同标注场景下的标注格式规范。注意:每张图片对应的标注内容的文件大小上限为1M。

图片分类

1)TI 平台格式

文件目录要求:



标注文件格式要求:
{
"info": { // 可选字段,表示图片的相关信息
"md5": "图片md5值", // 可选字段,表示图片的md5值
"path": "图片相对路径",
},
"tags": {
"classification_tags": [{
"first_class": "一级标签值",
"confidence_level": 置信度 // 可选字段,表示标签置信度
}]
}
}

2)文件目录结构

文件目录要求:



标注文件格式要求:无需额外上传标注文件

目标检测

1)TI 平台格式

文件目录要求:



标注文件格式要求:
{
"tags": {
"detection_tags": {
"shapes": [{
"frame_type": "框形状", // 表示框形状,支持多边形:polygon, 矩形:rect, 和折线:polyline
"pts": [x1, y1, x2, y2...],
"bbox": [左上角横坐标, 左上角纵坐标, 长, 高],
"tag": [{
"label_key_name": "标签字段",
"label_value_name": ["标签值"],
"confidence_level": [置信度] // 可选字段, 表示标签置信度
}]
}]
}
},
"info": { // 可选字段,表示图片的相关信息
"md5": "图片md5值", // 可选字段,表示图片的md5值
"path": "图片相对路径"
}
}

2)Pascal Voc

文件目录要求:


标注文件格式要求:(xml 文件格式)
<annotation>
<folder>VOC2012</folder>
<filename>2007_000033.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>500</width>
<height>366</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>aeroplane</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>9</xmin>
<ymin>107</ymin>
<xmax>499</xmax>
<ymax>263</ymax>
</bndbox>
</object>
</annotation>

3)COCO

文件目录要求:



标注文件格式要求:请严格参考 COCO 官网中的【Object Detection】格式

图片分割

1)TI 平台格式

文件目录要求:



标注文件格式要求:
{ "tags": { "segmentation_tags": { //【注意】导入到标注平台,shapes 和 mask 应该是二选一提供,如果同时提供则以shapes为准;从标注平台导出,shapes 和 mask 都会给出; "shapes": [{ "frame_type": "框形状", // 表示框形状,公有云支持多边形:polygon,必选 "pts": [ [x1, y1, x2, y2...] ], "bbox": [左上角横坐标, 左上角纵坐标, 长, 高], //非必选,pts表示分割区域外接矩形框 "tag": { "label_value_name": "标签值", "confidence_level": 置信度 // 可选字段,表示标签置信度 } }], "mask": { "path": "mask图相对路径", "notes": { "灰度值": "标签值" } } } }, "info": { // 可选字段,表示图片的相关信息 "md5": "1e81a232952f32af71b70848556e0ecd", // 可选字段,表示图片的md5值 "path": "图片相对路径" } }


2)Pascal Voc

文件目录要求:




标注文件格式要求:(xml文件格式要求)
<annotation>
<folder>VOC2012</folder>
<filename>2007_000039.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>500</width>
<height>375</height>
<depth>3</depth>
</size>
<segmented>1</segmented>
</annotation>

3)COCO

文件目录要求:



标注文件格式要求:请严格参考 COCO 官网中的【Object Detection】格式

目标跟踪

TI 平台格式

文件目录要求:



标注文件格式要求:
{
"tags": {
"detection_tags": {
"shapes": [{
"frame_type": "框形状", // 表示框形状,支持多边形:polygon, 矩形:rect, 和折线:polyline
"pts": [x1, y1, x2, y2...],
"bbox": [左上角横坐标, 左上角纵坐标, 长, 高],
"tag": [{
"label_key_name": "标签字段",
"label_value_name": ["标签值"],
"confidence_level": [置信度] // 可选字段, 表示标签置信度
}]
}]
}
},
"info": { // 可选字段,表示图片的相关信息
"md5": "图片md5值", // 可选字段,表示图片的md5值
"path": "图片相对路径"
}
}

文本分类

文本分类场景下的“文本数据”和“标注信息”的组织形式请参考数据集导入前端页面的提示卡片,如:



此外,再补充说明在 “TI 平台格式”和 “JSON” 格式中,还能灵活扩展支持的标签格式(按行和按文件同理):
- 一级单选的格式
"情感": "负"
"情感": "正"

- 一级多选的格式
"领域": ["政治","经济"]
"领域": ["娱乐","社会"]