数据标注操作界面说明

最近更新时间:2023-12-13 16:54:43

我的收藏

概述

数据标注功能模块为用户提供专业、高效的标注操作台。 以下依据标注操作台的不同呈现形式分别为您介绍:
1. 用于“图片分类”标注任务的“分类类型标注操作台”;
2. 用于“目标检测、目标跟踪、图片分割”的“检测类型标注操作台”;
3. 用于“识别/检测、智能结构化”的“OCR 类型标注操作台”。

分类类型标注操作台

基于分类场景,采用小图列表平铺的操作台模式,方便用户快速分类多张图片。 页面右上角支持用户单击筛选图片的不同作业状态“全部数据/有标注结果/无标注结果”。 在操作台右侧区域是标注任务的标注值集合区,供用户检索和赋予当前选中图片的标注值。

支持的快捷键清单: 上一张图片:键盘字母 “A”; 下一张图片:键盘字母 “D”。

检测类型标注操作台

基于检测类型的场景,为了用户能更清楚的分辨并绘制图片中指定物体的位置,采用一张大图 + 一排缩略图列表的操作台模式。 右上角支持用户单击筛选图片的不同作业状态“全部数据/有标注结果/无标注结果”。 在操作台右侧区域是标注任务的标注值集合区,供用户赋予当前选中物体对应的标注值;在操作台上方区域为本次标注任务场景支持的所有标注工具的集合:矩形、多边形、线段等。

标注工具清单介绍:
矩形:绘制矩形框(支持快捷键 Ctrl+1);
多边形:绘制多边形框,左键描点,右键结束;且支持用户固定可绘制的多边形点数(支持快捷键 Ctrl+2);
线段:绘制线段,左键描点,右键结束(支持快捷键 Ctrl+3);
置入底层:将绘制的框或线段等置入页面底层(支持快捷键 Ctrl+4);
取消着色:取消框区域的默认填充色,使得标注区域透明,更能清楚的看到标注区域的图片内容;
删除:指定选中绘制好的框或线段后可删除(支持快捷键 Ctrl+D);
复制/粘贴:复制/粘贴绘制好的框或线段对象,该操作会同时复制对象的标注值属性(支持快捷键 Ctrl+C / Ctrl+V);
缩放:目前仅支持多边形和折线的缩放;
图片全屏:单击后可全屏查看图片大图;
上一步/下一步:撤销上一步/下一步操作;
快捷键清单介绍:1)上一张图片:键盘字母 “A”;2)下一张图片:键盘字母 “D”。

OCR 类型标注操作台

基于 OCR 标注场景下的“识别/检测”和“智能结构化”两种标注类型,TI 平台提供了专门的标注操作台和自研的结构化标注语言——描述子。

标注工具及快捷键介绍

您可在标注过程中,单击标注操作台右上角的使用说明按钮查看详细说明。



标注模式介绍

在标注操作台的右侧打标签区域,提供了两种模式:标准模式和专业模式(两种模式可互相转换)
标准模式 在“识别/检测”和“智能结构化”两种标注类型下都提供简易版的标注模式,用户可直接通过前端页面点选按钮决定检测识别文字的方向(水平/竖排);或者通过点选的形式配对结构化中的 key 值和 value 值。
专业模式 在“智能结构化”的标注类型下,提供了专业标注模式,支持用户输入自研的描述子语言适配结构化 OCR 下复杂的文字场景。以下详细介绍描述子语言。



描述子语言介绍

智能结构化输出的结果主要就是 key-value 对,简称 kv。例如 key-value 对:发票代码(key)-- 141001950242(value);发票号码(key) -- 30148556(value)。因此,字段属性中最重要的属性就是 kv 属性。同时,在 OCR 的真实业务场景下,经常存在嵌套 kv、字段不完整、字段分行、附加 key 字段、或者对 key 字段进行归一化等复杂多样的诉求。所以 TI 平台提出了自研的描述子标注语言来灵活的适配表达各种 OCR 场景。

kv 属性:k 段描述子和 v 段描述子

描述一个字段是 key 还是 value(分别称为 k 字段和 v 字段),及其 kv 关联关系。k 字段和 v 字段可以独立存在,也可以共同存在并且有关联关系。kv 关联关系有以下几种:
1k0v:表示只有 k 字段,没有关联的 v 字段;
0k1v:表示只有 v 字段,没有关联的 k 字段;
1k1v:表示1个 k 字段关联1个 v 字段,k 字段和 v 字段都在图片上出现;
1k1v:表示图片中只出现了 v 字段,但这个 v 字段需要关联一个附加 key 名(通过在字段文本中使用@@来标识附加 key 名);
1knv:表示1个 k 字段关联多个 v 字段,通常会出现在 v 字段是多行的情况;
nk1v:表示多个 k 字段关联1个 v 字段,通常会出现在嵌套表格或行列表格的情况。
示例:输入“k3,5”:表示字段3和字段5构成 kv 关系,3是 key 框,5是 value 框。

完整性(complte)属性:c 段描述子

描述一个字段是否完整表达一个含义(如果可以完整表达,称为完整字段),当需要多个字段组合时,需要描述组合的顺序关系。大多数情况下,一个字段可以表达一个完整含义,但有时候由于分行、文字竖排等各种原因,多个字段有序的连起来才能表达一个完整含义。
c 字母后接以下格式数字,定义:
0:本字段是完整字段(这种情况下可以不出现c段描述子);
fid1, fid2...:fid表示每个框的 ID 序号,表明本字段不是完整字段,用逗号有序隔开的多个字段组合起来才能表达一个完整含义。
示例:字段5的描述子输入为:5kc5,7;字段7的描述子输入为:7kc5,7。则表示5、7两个字段组合起来表达完整含义。