首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据标注有哪些类型?

人工智能深度学习的数据标注已经发展成为一个全新的行业,机器学习对于数据的需求不仅仅数量在上升,质量和精确度也在不断的增加。在这样一个行业背景下,对于像数据标注师、质检师和项目经理等专业人才的需求量也大量增加。所以,想要加入这个行业,不仅仅要学习了解什么是数据标注?更要学习数据标注的类型有哪些,并且能够在相应的项目标注平台上熟练操作。

常见的数据标注类型

数据标注有很多类型,如分类标注、标框标注、描点标注、区域标注等。接下来,精数标注研究院带大家学习几种常见的数标注分类,希望对大家在学习工作中有所帮助。

基础的数据标注类型有计算机视觉、语音工程、自然语言处理。

1、计算机视觉类:

计算机视觉

拉框标注:用2D框、3D框、多边形框等标注出图像或视频数据中的指定目标对象。

语义分割:标记图像中存在的内容及位置,根据属性进行像素级分割,支持单属性、多级属性。

3D点云标注:将点云数据图像中的多类指定对象使用3D框进行标注。

关键点标注:对人脸关键点、人体骨骼关键点、人脸五官等进行关键点标注。

线标注:支持贝塞尔曲线和普通线段标注,支持对车道线进行贝塞尔曲线标注,使用线段将图像目标的边缘、轮廓用线段标注。

2D/3D融合标注:对2D平面图与3D点云图映射的数据组进行标注,支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。

2、自然语言处理类:

自然语言处理

OCR转写:将图像中的文字进行识别,并以文本的形式转写。

文本信息抽取:把文本里包含的信息进行分类和打标签等结构化处理。

NLU语句泛化:基于特定文本数据进行多角度泛化,以不同的描述方式重组语句。

词性标注:基于特定文本数据进行词性理解标注,如动词、名词、形容词等。

情感判断:针对指定文本数据,判断该文本的情感类别并给出相应的标签,如积极、消极等。

3、语音工程类:

语音工程

ASR语音转写:提取语音数据特征,转写为对应的文本或命令。

语音情绪判定:从语音数据中识别说话人的情绪状态。

声纹识别标注:对音频数据中的说话人进行辨认或确认。

语音切割:根据需求,将语音实现分段切割。

按照标注的难易程度来划分,可以分为常识性标注和专业性标注:

1、常识性标注:比如标注道路标线、路牌、地图等数据,语音识别标注等数据都属于常识性标注。这种类型的标注因为应用的场景多且复杂,所以需要大量的标注训练样本,标注员只要认真负责、项目完成效率高、质量好就是一名好的的标注师。

地图标注

2、专业性标注:比如医疗诊断、航空航天、电力系统等专业领域的标注。该类型的标注工作需要有领域专业知识的标注员,或者称为标注专家,标注的工作难度也大。

智慧医疗

以上就是给大家介绍的关于常见的数据标注类型的内容,除了这些大类外,每个大类下面又细分很多小类,有机会再给大家详细地介绍每个细分类型的内容及应用。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220902A07GWJ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券