首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据标注的注意事项(图片、语音、文本...)

数据标注的注意事项(图片、语音、文本...)

图片

a.属性:拉框标注或语义分割时,其标注对象就是将图像中所需标注类别分别进行框选/分割标注,框选之后每个框都会有一个对应的类别

b.贴合度:在被遮挡的情况下,遮挡部分需要脑补,但是不要脑补到图像外

c.规则性:不遗漏框/打点数,不误标框/打点数,不多标框/打点数

d.勿漏标:若出现图像较模糊无法标注的则不标,也不漏标

文本

a.方式统一:同类标注属性,标注方式要保持一致

B.内容格式分类:在文字标注过程中,由于部分文字间隔近,若同页中有相同的元素,可以考虑隔行标注,避免标注都挤到一起

c.标签具体细节:标注标签的定义要细化到集体场景,前期主观性的标签要具象明确好详细的标签边界

d.避免漏标:同时标多个标签时,要避免漏标、错标、多标

语音

a.数据确认:确定是否包含有效语音;确定语音的噪声情况,确定说话人数量确定说话人性别、确定是否有口音、有效语音内容转写

b.无效数据:整句话无法分辨出内容的,标为无效,背景噪音过大的,标为无效

c.杂音辨析:在语音标注中,除了被采集者的声音外,还可能听到其他的背景音,在一般情况下,这些都可以被当作杂音进行处理

d.预留时间:要保证音频前后静音两秒,截取时间过长或过短都不符合标注规

e.工具使用:语音标注的过程中的最好是使用降噪耳机,如果耳机质量不高在标主过程中,会产生很多的杂音不利于标注,容易出错

3D

目标本身须全部被3D框包围,不漏点且不包含噪点若目标物体边界清晰,则3D框边界距离目标主体真实边界最多不能大于10cm

b.若行人若带有背包、雨伞等物件,行人的3D框需包含这些小物件

若行人距离过近时,行人框可能有一定程度的重叠可正常标注

若出现一些特殊辆时,如扫水车、水泥罐等,需要按照最大外接立方体的形状去标注出3D框:若出现一辆分成多个部分的情况,比如拖挂多节的卡、多截的公交等,需要将每一节体分别标注3D框

要注意三视图是否贴合;注意正前方方向是否正确所有地面上的目标物体其3D标注框底部须贴合地面,不能高于地面或低于地面

若目标物体距离过远导致目标所在区域点云稀少、没有地面点或者难以确定3D框下底面高度的情况时,可参考最近的地面点云线的高度和点云中距离最近的

e.3D框来确定大致高度点云框要按照车辆行驶方向标注且方向要正确

f.注意不遗漏框,不误标框,不多标框,残影和杂点不需要标注

g.注意框要求紧密贴合点云,不可漏标点,外围边界不然后呢超过清晰点云边界的10cm位置,标注准确率在99%以上

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oos90LEOxjYvLQQdA1wGC34Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券