专栏首页图像识别与深度学习2018-04-21 语义分割Semantic segmentation

2018-04-21 语义分割Semantic segmentation

按难易程度进行分类:从易到难*--->***

一、易

1、图像语义分析学习(一):图像语义分割的概念与原理以及常用的方法 定义,算法

应用:自动驾驶系统(具体为街景识别与理解)、无人机应用(着陆点判断)

Grouping, segmentation

1.1基于图划分(Graph partitioning):需要用户交互操作

(1)Normalized Cut图像分割

(2)Grab cut:RGB 图像的前景和背景分别用一个高斯混合模型(Gaussian mixture model, GMM)来建模

1.2深度学习(Deep learning, DL)

(1)全卷积神经网络(Fully convolutional networks,FCN):直接进行像素级别端到端(end-to-end)的语义分割,基于深度卷积神经网络模型(CNN)实现。

?全连接层,卷积层,池化层,上采样,下采样 见2

(2)Dilated Convolutions:在去掉池化下采样操作的同时,而不降低网络的感受野

(3)条件随机场(Conditional random field,CRF)

2、十分钟看懂图像语义分割技术 前面同1,池化,

深度神经网络:输入层、中间层、输出层

2.1卷积神经网络算法(Convolutional Neural Networks),简称 CNN。卷积神经网络就是一种深度神经网络

图像输入,卷积核

全连接层:一维向量

CNN 的输入是图像,输出是一个结果,或者说是一个值,一个概率值

2.2 FCN 即 全卷积神经网络(Fully Convolutional Networks)。

FCN 输入是一张图片是,输出也是一张图片,学习像素到像素的映射。

CNN 网络中的后三层,都是一维的向量,计算方式不再采用卷积,所以丢失了二维信息,而 FCN 网络中,将这三层全部转化为 1*1 的卷积核所对应等同向量长度的多通道卷积层,使后三层也全部采用卷积计算,整个模型中,全部都是卷积层,没有向量,所以称为 “全卷积”。

FCN 将第 6 层和 7 层分别从 4096 长度的向量转化为 4096 通道的卷积层,第 8 层则是 21 通道的卷积层。之所以第 8 层从 1000 缩减到 21,是因为 FCN 使用的识别库是 PASCAL VOC,在 PASCAL VOC 中有 20 种物体分类,另外一个 background 分类。(关于 PASCAL VOC 参见附录)

二者区别图:红色框中的部分

池化简单来说就是将输入图像切块

CNN 最终只输出一个结果:“这个图上是个啥”:不需要上采样

FCN 是像素级别的识别,也就是输入有多少像素,输出就要多少像素,像素之间完全映射,并且在输出图像上有信息标注,指明每一个像素可能是什么物体 / 类别。上下采样均需要

每一个卷积层,都包含了 [卷积 + 池化] 处理,这就是传说中的 “下采样”:图像的像素信息变小了

反卷积”,对第 5 层进行反卷积,可以将图像扩充至原来的大小, 称为 “上采样”

2.3Dilated Convolutions疏松的卷积核

条件随机场”( Conditional Random Field,简称 CRF)的技术作为输出结果的优化后处理手段,还有马尔科夫随机场 (MRF) 和高斯条件随机场 (G-CRF) 

二、译文,难*****

1、深度学习-语义分割总结    定义、分类、汇总

三、项目中可能用到的

1、专栏 | CVPR 2017论文解读:Instance-Aware图像语义分割

物体分割(instance aware segment)有别于语义分割。在语义分割中,同一类的物体并不区分彼此,而是统一标记为同一类。但物体分割需要区分每一个独立的个体。

2、图像分类,物体检测,语义分割,实例分割的联系和区别

Image Classification 

The task of object classification requires binary labels indicating whether objects are present in an image.[1]   图像分类,该任务需要我们对出现在某幅图像中的物体做标注。比如一共有1000个物体类,对一幅图中所有物体来说,某个物体要么有,要么没有。可实现:输入一幅测试图片,输出该图片中物体类别的候选集

Object detection ****

Detecting an object entails both stating that an object belonging to a specified class is present, and localizing it in the image. The location of an object is typically represented by a bounding box.  物体检测,包含两个问题,一是判断属于某个特定类的物体是否出现在图中;二是对该物体定位,定位常用表征就是物体的边界框。可实现:输入测试图片,输出检测到的物体类别和位置。

Semantic scene labeling 

The task of labeling semantic objects in a scene requires that each pixel of an image be labeled as belonging to a category, such as sky, chair, floor, street, etc. In contrast to the detection task, individual instances of objects do not need to be segmented. 语义标注/分割:该任务需要将图中每一点像素标注为某个物体类别。同一物体的不同实例不需要单独分割出来。对下图,标注为人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5.

Instance segment  

实例分割是物体检测+语义分割的综合体。相对物体检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割可以标注出图上同一物体的不同个体(羊1,羊2,羊3...)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 2018-06-30 python 格式化输出%s

    %-*s 代表输入一个字符串,-号代表左对齐、后补空白,*号代表对齐宽度由输入时确定

    用户1733354
  • 2018-06-14Ubuntu常用命令

    用户1733354
  • 2018-04-21CNN经典模型

    用户1733354
  • 一次不成功的深度学习实践-微信跳一跳

    最近微信的跳一跳小程序火了一把,所以前天也更新了微信玩了几盘,最多手动到200左右就不行了。 ? 后来准备用代码写个辅助工具,上Github一查,已经有人做出来...

    企鹅号小编
  • 微信跳一跳之深度实践

    最近微信的跳一跳小程序火了一把,所以前天也更新了微信玩了几局,最多手动到200左右就不行了。

    疯狂的小程序
  • 一次不成功的深度学习实践 - 微信跳一跳

    张宏伦
  • AI 技术讲座精选:在 Pinterest 上的视觉发现

    摘 要 在过去的三年中,Pinterest 已经针对几款视觉搜索和推荐服务做出了相关的实验,其中就包括 Related Pins (2014)、Similar ...

    AI科技大本营
  • 国庆了,用照片拼个中国地图吧?

    几天前的给头像加国旗,当时我们 Python 代码来实现时,采用的思路是以头像做背景,向上贴中间透明的带有国旗的头像框图。

    TTTEED
  • Threejs 快速入门

    在什么都是3D,看电影3D,打游戏3D,估计3D打车,很快就会面世。那么作为前端开发的标准语言,JS和3D能不能也搞出点大新闻呢?刚好最近在做一个活动时,就遇到...

    周明礼
  • 自动驾驶领域上演三国演义,谁能最终胜出?

    上个世纪,世界大国的竞赛主要集中在太空领域,美苏两国在太空领域剑拔弩张。而本世纪的竞争则落地了,主要表现在自动驾驶领域。谁能首先让自动驾驶汽车上路,谁能让自动驾...

    机器人网

扫码关注云+社区

领取腾讯云代金券