今日科普篇丨教人工智能认识世界，它要学会这三大个类别的数据

文章来源：企鹅号 - 数据标注微课

AI训练师被称为人工智能的“老师”，他们为数据贴上标签就是为了让AI机器人更容易识别数据，通过数据更好地认识这个世界，例如，将下图中的车识别出来，人看到车的外轮廓是：

但是需要让电脑去识别认知这个图中的车，电脑需要的是下图这种json或者xml结构，才能认知出车

这个让电脑认识车的这个能力，是通过人工智能算法+标注数据，训练得出来的。通常想要得到人工智能识别一个物体的能力达到99%，需要数万的标注数据，才可能训练出来。所以，随着人工智能应用的大量需求，标注数据的需求量也在成倍地增长

通常我们都知道数据标注有语音、图像、文本、视频等不同类型的标注，今天呢，我们将从数据标注的类别出发，让大家对标注有一个深入的了解

形象类

矩形拉框

这属于数据标注中的2D拉框，通常需要拉一个矩形框来配合框架选择要检测的对象（人、动物、汽车等）。从框中选择要检测的对象后，应在所选框中添加一个或多个标签来指示该对象。如果是人，可能需要注明性别、年龄、衣着等

多边形拉框

多边形拉框类似于矩形拉框，但多边形拉框要求较高，需要围绕标记元素的轮廓进行标记，多为点框形式。由多边形绘制的框通常需要标记以指示元素

点划线

点划线需要根据要求在面上或关键部位进行，往往会对每个点的位置进行限制和要求，从而实现高精度的检测和识别。这种贴标对人员要求比较高，但是对应的贴标单价会高很多

OCR识别

OCR识别分为两部分：一部分是拉框，选择要检测的部分。这部分类似于上面的多边形拉框，另一部分需要高精度的传递选中部分的内容。这种标记数据常用于文本检测模型的训练

语义切分

这种标注相对于拉盒占的比例较小，但目前有增加的趋势。这种标注需要区分图片中的元素，并分别标注和填充各个部分。一般要告诉ps抠图，先把这部分元素抠出来，再选择属性标签，这样这部分元素就可以抠出来了

图片评论的分类

这种标注需要根据需求判断图片。有些图片需要分类，有些在判断图片内容时符合要求，有些在判断两张或几张时属于同一类

语音类

注音

注音是最常见的注音之一，播音员需要听一段语音，然后将听到的语音进行转录。按语言可分为汉语、外语、方言。根据时间长短，可分为分段语音和长语音。一般少于一分钟（通常三秒左右）的语音为短语音，其中语音的长度、音质、预标结果、切音等因素都会极大地影响语音转录的难度

其他类型的语音标注

其他类型的语音标注所占比例相对较小，比如对于一段文字和语音来说，判断文字和语音内容是否对应，或者对于一个语音标注者来说，识别语音是否包含非法敏感元素

文本类

情感标注

这种标注通常需要确定一个句子所包含的情感，比如三级情感标注（正面、中性、负面），要求高的会分为六级甚至十二级情感标注

实体标注

实体标注需要提取一个句子中的实体，比如电视、足球、门等。有时候需要划分这句话的类别，比如音乐，百科，新闻等。或者在文字中标出动作说明（开门、玩耍等。)

相似性判断

这个标准多集中在两个文本中，通常需要判断两句话表达的意思是否一致。如果与标准1一致，与标准－1不一致，则不能判断标准为0

其他类型的文本标注：其他类型的文本标注，比如舆情标注，判断一篇文章中提到的公司是有正面影响还是负面影响。还有文章敏感度测试，判断文本内容是否有非法敏感信息

值得一提的是，在人社部公布的国家职业分类目录中，数据标注被认定为“人工智能训练师”（AI训练师），它包含数据标注员、人工智能算法测试员两个工作方向，随着人工智能在智慧城市、智能制造、自动驾驶等各行各业的广泛应用，社会对人工智能训练师的需求也将迎来爆发式增长

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货