前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何进行数据标注(2)

如何进行数据标注(2)

作者头像
用户7699929
发布2020-08-27 14:47:38
1.2K0
发布2020-08-27 14:47:38
举报
文章被收录于专栏:一刻AI一刻AI一刻AI

现在网络上关于深度学习算法的文章很多,但深度学习其实是数据驱动型。很多时候数据足够好,能给算法开发提供很大的便利。今天来介绍一下如何进行数据标注。

文章共两个部分:(1)数据标注综述(2)数据标注指南

本文是第二部分:数据标注指南。本文可能会帮助读者更直观的认识对图片标注中的问题。

1、笔记来源

本文的标注要点来源于图像标注专家Adela Barriuso的标注笔记。她于2007年开始使用labelme系统地标注SUN数据库,标注了 超过25万个物体。笔记记录了标注过程中曾遇到的困难和采用的解决方案,以便得到一致性高的图片标注。

Adela Barriuso在西班牙的一家服装店里进行数据标注,这就是传说中的大隐隐于市吗?

2、标注笔记

下面是Adela Barriuso在数据标注中的心得:

· 在标注图像时,首先对图像进行整体的评估,衡量标注难度。有些乍一看标注难度较大的图像,实际上图中的元素很少,很容易标记。

· 标注时,通常由大到小进行标注。比如开放空间中先标注天空,封闭空间内先标注天花板,然后再继续添加其他东西。

· 标记的顺序不重要,但标注时最好一行行进行,将一行内所有类型相同的对象全都标注上,降低标签写错的可能。

· 一般不标注镜子里反射的物体,这很容易造成误导。

· 在图像中有很多线条性物体时(如下图中的扶手和栏杆),需要特别注意,有可能标注出与所需完全相反的内容(即孔内被标记为对象),标注线在同一个位置经过两次是正常的,刻意避免可能会出现上述情况。

· 标注图像中出现打开的门窗等情况时,不仅仅要标注门窗,也应将门窗内的物体也标注上,这有助于增加深度感。

· 标注时的标注线条要清晰一些,尽量避免线条的堆积。

· 像下图中的这种过于复杂的图片,如果你对图中的内容不够熟悉,就干脆跳过去。

· 如果一个物体被另一个物体遮挡,在给他们做标注时要给两个物体都贴上标签,同时确保它们的边缘重合。

· 在进行标注时有时需要放大和缩小,放大有助于标注一些小细节,但放大有可能造成错乱。有些东西的局部放大后变得像其他物体。因此在标注之后需缩放至原始大小进行审核。

· 标注室内空间时,一般单独标记不同方向的墙,即便它们是相互连接的。

· 在下图中,图像的复杂性是由于墙壁和拱门形成的不同深度平面造成的,在标记时需要给拱门内的元素进行标记。首先从两堵墙开始,然后给墙壁和容易分辨的大物体进行标注,最后再去标注小的一些细节。有时候遗漏是不可避免地

· 有时候某些容器是透明的,比如透明的容器内装着一些饼干,这时候是标注“容器”还是“饼干”呢?一般标注为“容器”,重点在于要保持标注原则的前后一致。

· 有时候标注标签并非自己的母语,当标注的目标物种类较多时,一定要建立一个标签的对应关系,方便查找,如bed:床

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一刻AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、笔记来源
  • 2、标注笔记
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档