首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

今日科普篇丨教人工智能认识世界,它要学会这三大个类别的数据

AI训练师被称为人工智能的“老师”,他们为数据贴上标签就是为了让AI机器人更容易识别数据,通过数据更好地认识这个世界,例如,将下图中的车识别出来,人看到车的外轮廓是:

但是需要让电脑去识别认知这个图中的车,电脑需要的是下图这种json或者xml结构,才能认知出车

这个让电脑认识车的这个能力,是通过人工智能算法+标注数据,训练得出来的。通常想要得到人工智能识别一个物体的能力达到99%,需要数万的标注数据,才可能训练出来。所以,随着人工智能应用的大量需求,标注数据的需求量也在成倍地增长

通常我们都知道数据标注有语音、图像、文本、视频等不同类型的标注,今天呢,我们将从数据标注的类别出发,让大家对标注有一个深入的了解

01

形象类

矩形拉框

这属于数据标注中的2D拉框,通常需要拉一个矩形框来配合框架选择要检测的对象(人、动物、汽车等)。从框中选择要检测的对象后,应在所选框中添加一个或多个标签来指示该对象。如果是人,可能需要注明性别、年龄、衣着等

多边形拉框

多边形拉框类似于矩形拉框,但多边形拉框要求较高,需要围绕标记元素的轮廓进行标记,多为点框形式。由多边形绘制的框通常需要标记以指示元素

点划线

点划线需要根据要求在面上或关键部位进行,往往会对每个点的位置进行限制和要求,从而实现高精度的检测和识别。这种贴标对人员要求比较高,但是对应的贴标单价会高很多

OCR识别

OCR识别分为两部分:一部分是拉框,选择要检测的部分。这部分类似于上面的多边形拉框,另一部分需要高精度的传递选中部分的内容。这种标记数据常用于文本检测模型的训练

语义切分

这种标注相对于拉盒占的比例较小,但目前有增加的趋势。这种标注需要区分图片中的元素,并分别标注和填充各个部分。一般要告诉ps抠图,先把这部分元素抠出来,再选择属性标签,这样这部分元素就可以抠出来了

图片评论的分类

这种标注需要根据需求判断图片。有些图片需要分类,有些在判断图片内容时符合要求,有些在判断两张或几张时属于同一类

02

语音类

注音

注音是最常见的注音之一,播音员需要听一段语音,然后将听到的语音进行转录。按语言可分为汉语、外语、方言。根据时间长短,可分为分段语音和长语音。一般少于一分钟(通常三秒左右)的语音为短语音,其中语音的长度、音质、预标结果、切音等因素都会极大地影响语音转录的难度

其他类型的语音标注

其他类型的语音标注所占比例相对较小,比如对于一段文字和语音来说,判断文字和语音内容是否对应,或者对于一个语音标注者来说,识别语音是否包含非法敏感元素

03

文本类

情感标注

这种标注通常需要确定一个句子所包含的情感,比如三级情感标注(正面、中性、负面),要求高的会分为六级甚至十二级情感标注

实体标注

实体标注需要提取一个句子中的实体,比如电视、足球、门等。有时候需要划分这句话的类别,比如音乐,百科,新闻等。或者在文字中标出动作说明(开门、玩耍等。)

相似性判断

这个标准多集中在两个文本中,通常需要判断两句话表达的意思是否一致。如果与标准1一致,与标准-1不一致,则不能判断标准为0

其他类型的文本标注:其他类型的文本标注,比如舆情标注,判断一篇文章中提到的公司是有正面影响还是负面影响。还有文章敏感度测试,判断文本内容是否有非法敏感信息

值得一提的是,在人社部公布的国家职业分类目录中,数据标注被认定为“人工智能训练师”(AI训练师),它包含数据标注员、人工智能算法测试员两个工作方向,随着人工智能在智慧城市、智能制造、自动驾驶等各行各业的广泛应用,社会对人工智能训练师的需求也将迎来爆发式增长

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221103A01X3U00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券