前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >无人驾驶应用中的图像语义分割框架-HRNet

无人驾驶应用中的图像语义分割框架-HRNet

原创
作者头像
乔大大
修改2020-11-25 10:17:04
1.4K0
修改2020-11-25 10:17:04
举报
文章被收录于专栏:视频图像视频图像

图像语义分割作为实现各类复杂视觉任务的基础之一,在现实中有很多应用。例如,无人驾驶技术中往往需要先实现对街景的语义识别。

HRNet网络架构是近年来表现不错的图像语义分割框架。HRNet不同于常规的Encoder-Decoder框架,而是尽可能自始至终保留高分辨率信息。HRNet 语义分割框架图中包含4类分辨率特征图信息。

HRNet 语义分割框架图
HRNet 语义分割框架图

HRNet 语义分割框架图

这4类分辨率特征图关系参考HRNet 语义分割branches图,每行特征图序列对应一个Branch。Branch 1所在行特征图分辨率为H*W,通道数为C ;Branch 2 所在行特征图分辨率为(H*W)/2,通道数为2C ;Branch 3 所在行特征图分辨率为(H*W)/4,通道数为4C ;Branch 4所在行特征图分辨率为 (H*W)/8,通道数为 8C 。

HRNet 语义分割branches图
HRNet 语义分割branches图

HRNet 语义分割branches图

HRNet框架中在列方向又将特征图分为4个stages。第2、3、4 stage,每个stage由一个或多个Modules组成。每个Module中包括多个Residual Unit,每个Residual Unit为Basic Block或Bottleneck Block类型。注: HRNet语义分割stages图中显示的主要为stages,并未体现Modules。

HRNet 语义分割 stages 图
HRNet 语义分割 stages 图

HRNet 语义分割 stages 图

Residual Unit 之 Basic Block  与 Bottleneck Block
Residual Unit 之 Basic Block 与 Bottleneck Block

Residual Unit 之 Basic Block  与 Bottleneck Block

HRNet框架中stage 1 主要由1个Layer构成,该Layer由4个Bottleneck Blocks串联组成。stage 2主要由1个Module构成,stage3由4个Modules构成,stage4由3个Modules构成。

至于Module结构,主要表现为多个Branches的Fuse。以stage4中的Module为例。该Module包括4个Branches部分,在Module结束时对各Branch进行Fuse计算。参考HRNet语义分割stage4 Module图。

HRNet 语义分割 stage4 Module
HRNet 语义分割 stage4 Module

HRNet 语义分割 stage4 Module

该Module中每个branch部分包括4个Residual Unit。每个Residual Unit为Basic Block 类型。在Module结束时通过一个Fuse Layer实现各特征图的Fuse。

HRNet 语义分割 stage 4 Module 中Residual Unit
HRNet 语义分割 stage 4 Module 中Residual Unit

HRNet 语义分割 stage 4 Module 中Residual Unit

HRNet 语义分割 stage 4 Module 中Fuse Layer
HRNet 语义分割 stage 4 Module 中Fuse Layer

HRNet 语义分割 stage 4 Module 中Fuse Layer

具体Fuse方法参考Fuse Layer中各Branch特征图Fuse方法图。可以看到有3类计算方法,每类计算方法的实现称为Exchange Unit。

Fuse Layer中各Branch特征图Fuse方法图
Fuse Layer中各Branch特征图Fuse方法图

Fuse Layer中各Branch特征图Fuse方法图

在HRNet官方代码实现层面,实现方法与上述原理说明略有不同。主要体现在各Stages之间的Fuse阶段。


代码语言:javascript
复制
新产学研项目研发
项目研发业务框架
项目研发业务框架
代码语言:javascript
复制
如果项目需研发,欢迎咨询!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像识别
腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档