计算机视觉之图像语义分割算法简单介绍

这段时间一直在分享,图像语义分割相关的论文,但是,发现自己都在写论文的算法细节,没有介绍技术背景,今天来通过几个问题简单地介绍一下人工智能算法计算机视觉图像语义分割算法的任务。

什么是语义分割?

语义分割可以看做是像素级别的分类任务,分割就是为图片中的每一个像素预测一个类别,像下面这幅图片中有一个人和马以及背景,语义分割的任务就是将图片中人、马和背景分割出来。

一般的语义分割数据集需要给出图片和它对应的正确分割的结果,即像素级别标注。

什么是像素级别标注?

如同下面这张图,虽然它是有颜色的,但是实际上存储的是一个二维图片矩阵,每一个位置上的值表示该像素属于的分类,假如数据集中人的分类数字是8,马是5,背景为0,则图片中黑色区域存储的数字是代表背景类别的0,橙色存储的是代表人类别的8,以及红色区域存储的是代表马的数字5.

什么是弱监督语义分割?

有像素级别标注的监督是强监督语义分割,而只有图片中物体类别,如同上面图片,数据集中仅给出一张图片以及该图片中包含人和马两个类别,而人和马在图片中什么位置并不给出,这是一个很粗糙的监督信息,利用类别标签作为监督进行语义分割任务就是弱监督语义分割的一种,其他的还有利用boundary box,涂鸦等等。

为什么要进行弱监督语义分割?

目标当然是省钱!省力!

从上面我们可以知道,强监督语义分割是像素级别的监督,得到的分割结果定然也是比较好的结果,相同条件下定然比弱监督要好,那么为什么还要研究弱监督语义分割呢?

因为强监督语义分割中要求的像素级别标注在人工标注数据集时,需要标注出每一个像素的类别,因此制作数据集时,需要耗费很大的人力成本和金钱成本,因此,若是能够利用较容易获得的类别标签完成语义分割任务必然是有极大价值的!

通过这几个问题,你是不是已经了解了图像语义分割以及弱监督语义分割了呢?如果还有什么问题,欢迎交流提问哦!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181204A1NMD500?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券